안녕하세요. 이번엔 전체 데이터 준비과정과 예측을 하나의 파이프라인으로 만들어보겠습니다.
이전에 했던 것들이 있기 때문에 간단히 만들 수 있는데요.
prepare_select_and_predict_pipeline이란 이름으로 파이프라인을 만듭니다.
preparation은 full_pipeline을 사용하고, feature_selection은 저번에 만들었던 TopFeatureSelector를 넣습니다.
svm_reg는 랜덤탐색으로 지지도벡터회귀한 값의 best_param_을 통해 만들고 확인해보면
성능이 그다지 좋지 않은 결과를 볼 수 있습니다.
하지만 제대로 만들어서, 일련의 파이프라인으로 자동화한다면 편리하게 느껴질 것 같습니다!
블로그 이 글의 상당 부분은 [핸즈온 머신러닝, 한빛미디어/오렐리앙 제롱/박해선] 서적을 참고하였습니다. 나머지는 부수적인 함수나 메서드에 대해 부족한 설명을 적어두었습니다. 학습용으로 포스팅 하는 것이기 때문에 복제보다는 머신러닝에 관심이 있다면 구매해보시길 추천합니다. 도움이 되셨다면 로그인 없이 가능한 아래 하트♥공감 버튼을 꾹 눌러주세요! 출처
'## 오래된 게시글 (미관리) ## > Python (Linux)' 카테고리의 다른 글
21. Python - MNIST를 이용한 분류 기초와 성능 평가 지표 (0) | 2018.11.28 |
---|---|
20. Python - 그리드 탐색을 이용하여 준비 단계의 옵션 자동 탐색하기 (0) | 2018.11.28 |
18. Python - 중요한 특성을 선택하는 변환기를 파이프라인에 추가하기 (0) | 2018.11.28 |
17. Python - 그리드 탐색을 랜덤 탐색으로 바꾸기 (2) | 2018.11.28 |
16. Python - 서포트 벡터 머신을 통한 하이퍼 파라미터 설정 (0) | 2018.11.26 |