본문 바로가기

#의사결정나무2

43. Python - 결정 트리(Decision Tree) 자. 오늘은 새로운 챕터, 결정 트리입니다.SVM처럼 결정 트리(Decision tree)는 분류와 회귀 작업 그리고 다중출력 작업도 가능한 다재다능한 머신러닝 알고리즘입니다. 또한, 매우 복잡한 데이터셋도 학습할 수 있는 강력한 알고리즘입니다.결정 트리는 최근에 자주 사용되는 가장 강력한 머신러닝 알고리즘인 랜덤 포레스트의 기본 구성 요소이기도 합니다. 이 장에서는 결정 트리의 훈련, 시각화, 예측 방법에 대해 먼저 알아보겠습니다.그리고, 사이킷런의 CART 훈련 알고리즘을 둘러보고 트리에 규제를 가하는 방법과 회귀 문제에 적용하는 방법에 대해 알아봅니다.마지막으로, 결정 트리의 제약 사항에 대해 알아보겠습니다. 결정 트리를 이해하기 위해 일단 하나를 만들어서, 어떻게 예측을 하는지 살펴보겠습니다.다음.. 2019. 2. 12.
42. 데이터마이닝-분류 분석 안녕하세요. 오늘은 데이터마이닝-분류 분석에 대해 알아보고자 합니다.시작하지용~ 1. 분류 분석 1) 분류 분석(Classfication) vs 예측 분석(Prediction) -공통점 : 레코드의 특정 속성의 값을 미리 알아 맞히는 점 -차이점 : (1) 분류 : 레코드(튜플)의 범주형 속성의 값을 알아 맞히는 것이다. (2) 예측 : 레코드(튜플)의 연속형 속성의 값을 알아 맞히는 것이다. -분류의 예 (1) 학생들의 국어, 영어, 수학 점수를 통해 내신 등급을 알아 맞히는 것. (2) 카드회사에서 회원들의 가입 정보를 통해 1년 후 신용등급을 알아 맞히는 것 -예측의 예 (1) 학생들의 여러가지 정보를 입력하여 수능 점수를 알아 맞히는 것 (2) 카드회사의 회원들의 가입정보를 통해 연 매출액을 알아.. 2018. 11. 22.