본문 바로가기

#R5

31. 데이터 구조와 데이터 프레임 II 안녕하세요.포스팅합니다! 오늘도 데이터 구조와 데이터 프레임에 대해 알아볼텐데요~오늘은 구조를 이해하고, 열과 행 데이터 추출/제거/변경, 여러 프레임 분할/결합/재생산, 구조 변경을 목적으로 알아보고자 합니다. 데이터 프레임을 잘 다룰줄 알아야 하는 이유는, 우리가 데이터를 분석하기 전에, 여러 데이터들을 분석하기 위한 최적의 구조로 만들어야 하기 때문입니다.따라서 데이터 분석보다 선행되어야 하는 것이죠.. #처음으로, 데이터프레임을 생성해봅니다. data.frame(1,2,3)# X1 X2 X3 #1 1 2 3 #이렇게 생성됩니다. #레코드 생성 new1 2018. 11. 22.
12. 기초통계분석의 개념과 시각화 방법 안녕하세요. 오늘은 기초통계분석 중 기술통계가 무엇인지 개념을 알아보고 간단히 시각화하는 작업이 무엇이 있는지 알아보겠습니다. 1. 기술통계 (desvriptive statistics) 1) 정의 : 데이터에 대한 통계적 자료분석에 앞서 데이터의 대략적인 통계적 수치를 계산해 봄으로서 데이터에 대한 대략적인 이해와 앞으로 진행될 분석에 대한 통찰력을 얻기 위한 분석방법이다. 2) 자료의 종류 (1) 변수 : 수집된 자료에서 관심의 대상이 되는 특성이나 관측된 결과로서 주어지는 특성 (2) 변수의 종류 : 질적변수(Qualitative Variable) 또는 범주형 변수(Categorial Variable) 양적변수(Quantitative Variable) : 연속형 변수(Continuous Variabl.. 2018. 11. 20.
7. airquality 데이터를 이용한 데이터변환 안녕하세요. 오늘은 R패키지 내에 내장되어있는 airquality 데이터를 이용하여 여러가지 데이터 변환(관리)을 해보겠습니다. airquality는 이름만 봐도 공기질에 대한 데이터가 있겠죠? 이 데이터는 R에 내장되어있어서 따로 패키지 설치를 할 필요가 없습니다. data(airquality) head(airquality) Ozone Solar.R Wind Temp Month Day 1 41 190 7.4 67 5 1 2 36 118 8.0 72 5 2 3 12 149 12.6 74 5 3 4 18 313 11.5 62 5 4 5 NA NA 14.3 56 5 5 6 28 NA 14.9 66 5 6 # data()함수로 airquality 데이터를 불러옵니다. 그럼 자동으로 불러와지는데요.# 항상 데이.. 2018. 11. 20.
5. R 연산 연습 안녕하세요~ 이번엔 R에서의 연산연습을 해보려고 합니다. 거두절미하고 바로 들어갈께요~ 자, 위의 그림처럼 일단 4가지를 해볼께요. # 함수내에서 연산 함수 내에서의 연산인데요, a라는 임의의 변수에 콤바인 함수를 써서 10에 사칙연산을 적용해 보았습니다. (a 2018. 11. 20.