본문 바로가기

R47

43. 데이터마이닝 - 분류분석 2 안녕하세요 오늘은 데이터마이닝 분류분석의 2번째 파트를 알아보도록 하겠습니다.오늘은 앙상블, 배깅, 부스팅, 랜덤포레스트 기법에 대해 알아보도록 하겠습니다. ^..^ 1. 앙상블 앙상블이란 주어진 자료로부터 여러 개의 예측모형들을 만든 후 예측모형들을 조합하여 하나의 최종 예측모형을 만드는 방법입니다. : 다중 모델 조합(combining multiple models, classifier combination) - 배깅 : (bagging : bootstrap aggregating) - Breiman(1996)에 의해 처음으로 앙상블 알고리즘 제안 - 부스팅(boosting) - Adaboost(adaptive boosting) - 랜덤 포레스트(random forest : 무작위 추출 randomiza.. 2018. 11. 22.
42. 데이터마이닝-분류 분석 안녕하세요. 오늘은 데이터마이닝-분류 분석에 대해 알아보고자 합니다.시작하지용~ 1. 분류 분석 1) 분류 분석(Classfication) vs 예측 분석(Prediction) -공통점 : 레코드의 특정 속성의 값을 미리 알아 맞히는 점 -차이점 : (1) 분류 : 레코드(튜플)의 범주형 속성의 값을 알아 맞히는 것이다. (2) 예측 : 레코드(튜플)의 연속형 속성의 값을 알아 맞히는 것이다. -분류의 예 (1) 학생들의 국어, 영어, 수학 점수를 통해 내신 등급을 알아 맞히는 것. (2) 카드회사에서 회원들의 가입 정보를 통해 1년 후 신용등급을 알아 맞히는 것 -예측의 예 (1) 학생들의 여러가지 정보를 입력하여 수능 점수를 알아 맞히는 것 (2) 카드회사의 회원들의 가입정보를 통해 연 매출액을 알아.. 2018. 11. 22.
41. 데이터마이닝 개요 안녕하세요. 요새 날씨가 미친듯이 덥네요. 에어컨 없이는 잠도 안옵니다. 그리고는 다시 비염이 도져서는....ㅠㅠ 오늘은 데이터마이닝을 알아보고자 하는데, 개요 부분만 간단하게 알아보도록 하겠습니다. 1. 데이터마이닝의 개요 *데이터마이닝은 대용량 데이터에서 의미 있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 방법이다. *통계분석과 데이터마이닝의 차이점 : 통계분석은 가설이나 가정에 따른 분석이나 검증을 하지만, 데이터 마이닝은 다양한 수리 알고리즘을 이용해 데이터로부 의미 있는 정보를 찾아내는 방법을 통칭한다. *데이터마이닝의 종류 1) 정보를 찾는 방법론에 따라 : 인공지능, 의사결정나무, K-평균 군집화, 연관분석, 회귀 분석, 로짓 분석, 최근접 이웃 2) 분석대상이나 활용 목적, 표현에 따.. 2018. 11. 22.
40. 다차원척도법 , 주성분분석 안녕하세요.오늘은 다차원척도법(Multi Dimensional Scaling)에 대해 알아보도록 하겠습니다. 다차원척도법은 군집분석과 같이 개체들은 대상으로 변수들을 측정한 후, 개채들 사이의 유사성/비유사성을 측정하여 개체들을 2차원 또는 3차원의 공간상에점으로 표현하는 분석방법입니다. 군집분석은 개체들 간의 비유사성을 이용하여 동일한 그룹들로 분류하는 것이 목적인 반면,다차원척도법은 개체들의 비유사성을 이용하여 2차원 공간상에 점으로 표시하고 개체들 사이의 집단화를 시각적으로 표현하는 것을 목적으로 합니다.주로 여러분들이 마케팅 하실때 보셨을 것 같네요~ 평면상에 2개의 척도를 놓고 기업들을 분류해놓는다던가 하는 그림을 많이 보셨겠죠~ 이제 시작하겠습니다. 1. 다차원척도법(Multidimension.. 2018. 11. 22.