분류 전체보기141 33. 데이터마트 안녕하세요. 오늘은 데이터마트에 대해 알아보고자 합니다. 데이터마트의 중요한 부분 중 하나인 요약변수와 파생변수의 구분에 대해 알아볼까요??모형을 개발할 때 문제를 가장 잘 해석할 수 있는 변수를 찾는 것이 중요하다는 것은 알고 계실테죠~! 그래서 데이터를 특정 기준에 따라 사칙연산을 통해 만들어 낸 변수가 요약변수이고, 사용자의 노하우를 기반으로 새롭게 만들어 낸 변수가 파생변수입니다.또 하나 알아볼 점은 Reshape 패키지 입니다. 이 패키지의 melt, cast() 함수는 아시는 분은 아실거라 생각합니다. 1. R reshape를 통한 데이터 마트 개발. 데이터마트란 데이터 웨어하우스와 사용자 사이의 중간층에 위치한 것으로, 하나의 주제 또는 하나의 부서 중심의 데이터 웨어하우스라고 할 수 .. 2018. 11. 22. 32. 데이터 변형 요번엔 데이터 변형에 대해 알아보도록 하겠습니다. a,b,c라는 곳에 Numeric 값을 집어넣어 볼게요~a 2018. 11. 22. 31. 데이터 구조와 데이터 프레임 II 안녕하세요.포스팅합니다! 오늘도 데이터 구조와 데이터 프레임에 대해 알아볼텐데요~오늘은 구조를 이해하고, 열과 행 데이터 추출/제거/변경, 여러 프레임 분할/결합/재생산, 구조 변경을 목적으로 알아보고자 합니다. 데이터 프레임을 잘 다룰줄 알아야 하는 이유는, 우리가 데이터를 분석하기 전에, 여러 데이터들을 분석하기 위한 최적의 구조로 만들어야 하기 때문입니다.따라서 데이터 분석보다 선행되어야 하는 것이죠.. #처음으로, 데이터프레임을 생성해봅니다. data.frame(1,2,3)# X1 X2 X3 #1 1 2 3 #이렇게 생성됩니다. #레코드 생성 new1 2018. 11. 22. 30. (NEW) 데이터 구조와 데이터 프레임 오늘은 데이터 구조와 데이터 프레임에 대해 알아보고자 합니다. 1. 벡터 (Vector) 데이터 분석의 가장 기본적인 데이터 구조는 벡터입니다. 여기서, 벡터는 여러 개의 원소를 가지는 하나의 변수입니다.R에서는 외부 데이터 Set이나 큰 데이터를 불러올 때 데이터프레임 구조로 불러와 분석을 실행하게 됩니다.벡터의 특징은, 1) 동질적이다 - 한 벡터의 모든 원소는 같은 자료형 또는 같은 모드(mode)를 가집니다. 2) 벡터는 위치로 인덱스 된다 - V[2]는 V벡터의 2번째 원소입니다. 3) 벡터는 인덱스를 통해 여러 개의 원소로 구성된 하위 벡터를 반환할 수 있다 - V[c(2,3)]은 v벡터의 2, 3번째 원소로 구성된 하위벡터입니다. 4) 벡터 원소들은 이름을 가질 수 있다 - V 2018. 11. 21. 이전 1 ··· 25 26 27 28 29 30 31 ··· 36 다음