본문 바로가기

분류 전체보기141

41. 데이터마이닝 개요 안녕하세요. 요새 날씨가 미친듯이 덥네요. 에어컨 없이는 잠도 안옵니다. 그리고는 다시 비염이 도져서는....ㅠㅠ 오늘은 데이터마이닝을 알아보고자 하는데, 개요 부분만 간단하게 알아보도록 하겠습니다. 1. 데이터마이닝의 개요 *데이터마이닝은 대용량 데이터에서 의미 있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 방법이다. *통계분석과 데이터마이닝의 차이점 : 통계분석은 가설이나 가정에 따른 분석이나 검증을 하지만, 데이터 마이닝은 다양한 수리 알고리즘을 이용해 데이터로부 의미 있는 정보를 찾아내는 방법을 통칭한다. *데이터마이닝의 종류 1) 정보를 찾는 방법론에 따라 : 인공지능, 의사결정나무, K-평균 군집화, 연관분석, 회귀 분석, 로짓 분석, 최근접 이웃 2) 분석대상이나 활용 목적, 표현에 따.. 2018. 11. 22.
40. 다차원척도법 , 주성분분석 안녕하세요.오늘은 다차원척도법(Multi Dimensional Scaling)에 대해 알아보도록 하겠습니다. 다차원척도법은 군집분석과 같이 개체들은 대상으로 변수들을 측정한 후, 개채들 사이의 유사성/비유사성을 측정하여 개체들을 2차원 또는 3차원의 공간상에점으로 표현하는 분석방법입니다. 군집분석은 개체들 간의 비유사성을 이용하여 동일한 그룹들로 분류하는 것이 목적인 반면,다차원척도법은 개체들의 비유사성을 이용하여 2차원 공간상에 점으로 표시하고 개체들 사이의 집단화를 시각적으로 표현하는 것을 목적으로 합니다.주로 여러분들이 마케팅 하실때 보셨을 것 같네요~ 평면상에 2개의 척도를 놓고 기업들을 분류해놓는다던가 하는 그림을 많이 보셨겠죠~ 이제 시작하겠습니다. 1. 다차원척도법(Multidimension.. 2018. 11. 22.
39. 시계열 분석 오늘은 시계열분석에 대해 알아보도록 하겠습니다요. 시계열자료는, 시간의 흐름에 따라 관찰된 데이터를 시계열 데이터 또는 시계열 자료라고 합니다. 이러한 시계열 자료에는 주식가격 데이터, 실업률, 기후데이터 등우리 주위에서 많이 찾아볼 수 있습니다. 이런 시계열 데이터의 분석 목적은, 미래의 값을 예측하거나(향후 주가, 다음달 매출액 예측 등), 시계열 데이터의 특성 파악(경향, 주기, 계절성, 불규칙성 등)을 위함입니다. 1. 시계열자료 1) 역사 -17세기 태양의 흑점 자료나 밀 가격지수 변동을 나타내는 함수로 sin, cos곡선 활용 -Yule(1926) - ARMA 개념 제시, Walker(1937) - ARMA 모형 제시 -Durbin(1960), Box&Jenkins(1970) - ARMA 모형.. 2018. 11. 22.
38. 회귀 분석 안녕하세요 오늘은 회귀분석에 대해 알아보겠습니다~ 시작~ 1. 회귀분석의 개요 1) 회귀분석의 정의 : 하나나 그 이상의 독립변수들이 종속변수에 미치는 영향을 추정할 수 있는 통계기법이다. : 변수들 사이의 인과관계를 밝히고 모형을 적합하여 관심있는 변수를 예측하거나 추론하기 위한 방법이다. 2) 회귀분석의 변수 : 영향을 받는 변수 (y) : 반응변수(response variable), 종속변수(dependent variable), 결과변수(outcome variable) : 영향을 주는 변수 (x) : 설명변수(explanatory variable), 독립변수(independent variable), 예측변수(predictor variable) 3) 회귀분석에서 검토사항 : 모형이 통계적으로 유의미한.. 2018. 11. 22.