본문 바로가기

R47

39. 시계열 분석 오늘은 시계열분석에 대해 알아보도록 하겠습니다요. 시계열자료는, 시간의 흐름에 따라 관찰된 데이터를 시계열 데이터 또는 시계열 자료라고 합니다. 이러한 시계열 자료에는 주식가격 데이터, 실업률, 기후데이터 등우리 주위에서 많이 찾아볼 수 있습니다. 이런 시계열 데이터의 분석 목적은, 미래의 값을 예측하거나(향후 주가, 다음달 매출액 예측 등), 시계열 데이터의 특성 파악(경향, 주기, 계절성, 불규칙성 등)을 위함입니다. 1. 시계열자료 1) 역사 -17세기 태양의 흑점 자료나 밀 가격지수 변동을 나타내는 함수로 sin, cos곡선 활용 -Yule(1926) - ARMA 개념 제시, Walker(1937) - ARMA 모형 제시 -Durbin(1960), Box&Jenkins(1970) - ARMA 모형.. 2018. 11. 22.
38. 회귀 분석 안녕하세요 오늘은 회귀분석에 대해 알아보겠습니다~ 시작~ 1. 회귀분석의 개요 1) 회귀분석의 정의 : 하나나 그 이상의 독립변수들이 종속변수에 미치는 영향을 추정할 수 있는 통계기법이다. : 변수들 사이의 인과관계를 밝히고 모형을 적합하여 관심있는 변수를 예측하거나 추론하기 위한 방법이다. 2) 회귀분석의 변수 : 영향을 받는 변수 (y) : 반응변수(response variable), 종속변수(dependent variable), 결과변수(outcome variable) : 영향을 주는 변수 (x) : 설명변수(explanatory variable), 독립변수(independent variable), 예측변수(predictor variable) 3) 회귀분석에서 검토사항 : 모형이 통계적으로 유의미한.. 2018. 11. 22.
37. 기초통계분석 1. 기술통계 (Descriptive Statistics) 1) 기술통계의 정의 -자료의 특성을 표, 그림, 통계량 등을 사용하여 쉽게 파악할 수 있도록 정리/요약하는 것 -자료를 요약하는 기초적 통계를 의미한다. -데이터 분석에 앞서 데이터의 대략적인 통계적 수치를 계산해봄으로서 데이터에 대한 대략적인 이해와 앞으로 분석에 대한 통찰력을 얻기에 유리하다. 2) 통계량에 의한 자료 정리 -자료(데이터) : x1, x2, x3, ... , x -표본평균(sample mean) : -중앙값(median) : 자료를 크기순으로 나열할 때 중앙에 위치하는 자료값이다. (중앙값의 순위는 (n+1)/2 , n이 홀수인 경우와 짝수인 경우에 따른 유의) -산포의 측도 : 대표적인 산포도(dispersion)는 분산,.. 2018. 11. 22.
36. 데이터분석의 이해 안녕하세요. 오늘은 데이터분석의 이해. 기초부분을 알아보도록 하겠습니당. 그럼 바로 들어가겠습니다. 1. 통계 -정의 : 특정집단을 대상으로 수행한 조사나 실험을 통해 나온 결과에 대한 요약된 형태의 표현.-조사 또는 실험을 통해 확보, 조사대상에 따라 총조사(census)와 표본조사로 구분한다.-총 조사는 대상 집산 모두를 조사하는 전수조사인데, 많은 비용과 시간이 소요되므로 특별한 경우를 제외하고는 사용되지 안는다.-표본조사는 대부분의 조사인데, 표본조사에서의 모집단은 조사하고자 하는 대상의 집단 전체를 의미한다.-원소는 모집단을 구성하는 개체이다.-표본은 조사하기 위해 추출한 모집단의 일부 원소이다.-모수는 표본 관측에 의해 구하고자 하는 모집단에 대한 정보이다.-모집단의 정의, 표본의 크기, 조사.. 2018. 11. 22.