본문 바로가기

전체 글141

26. Python - Matplotlib에 한글 사용법 import matplotlibmatplotlib.font_manager.get_fontconfig_fonts() Jupyter Notebook 안에서이렇게 치면 설치된 ttf 폰트들이 나옵니다.저는 제주고딕을 찾았고요~ 제주고딕이 있는 곳의 주소를 Ctrl+C합니다.그다음 이렇게 쳐주시면 되는데요.fname안에 저렇게 주소로 넣어줍니다. from matplotlib import font_manager, rcfont_name = font_manager.FontProperties(fname='/usr/share/fonts/JejuGothic/JejuGothic.ttf').get_name()rc('font', family=font_name) 이후 저장후 주피터노트북 커널을 종료해주시고, 터미널을 열어서, c.. 2019. 1. 23.
25. Python - 분류 연습문제 4 [ 스팸 필터 / 스팸 분류기 ] 안녕하세요. 오늘은 분류의 마지막 연습문제인 스팸 분류기를 만들어봅니다. 먼저, 데이터를 다운로드 하는데, 저자가 제공한 코드 그대로 쓰면 ReadError : file could not opened succesfully 오류가 납니다.(저만 그런가요. ham은 되는데, spam은 설치도 열리지도 않는걸로 보면, 뭔가 문제가 있습니다.) 그래서 저는 수동으로 설치하고 손으로 풀었어요. 혹시 몰라 코드 써놓을 테니 되시는 분은 그냥 쓰셔도 무방합니다. # 데이터 다운로드import osimport tarfilefrom six.moves import urllib DOWNLOAD_ROOT = "http://spamassassin.apache.org/old/publiccorpus/"HAM_URL = DOWNLO.. 2018. 12. 5.
24. Python - 분류 연습문제 3 [타이타닉 데이터셋 도전] 오늘은 분류 연습문제 3번을 해보겠습니다. 연습문제 3. 타이타닉 데이터셋을 통해 승객의 속성을 기반으로 생존 여부 예측을 하는 것이 목표먼저 Kaggle에 로그인하고, https://www.kaggle.com/c/titanic 에서 train.csv와 test.csv를 받으세요.그리고, 우리가 이전에 /root/ml에서 모든 것을 했었죠.마찬가지로 /root/datasets/titanic을 만들어서, train.csv와 test.csv로 훈련셋과 테스트셋을 옮깁니다. import osTITANIC_PATH = os.path.join("/root", "datasets", "titanic") import pandas as pddef load_titanic_data(filename, titanic_path=.. 2018. 12. 4.
23. Python - 분류 연습문제 1,2 1. MNIST 데이터셋으로 분류기를 만들어 테스트 세트에서 97% 이상의 정확도를 달성해보자. 힌트 : KNeighborsClassifier가 이 작업에 아주 알맞습니다. 좋은 하이퍼파라미터만 찾으면 되기 때문에 weights와 n_neighbors 하이퍼파라미터로 그리드 탐색을 시도해보자. 시작하자마자 오류가 생겼습니다. TerminatedWorkerError? 인가.. 그런 오류가 뜨더라구요. 어떻게 갑자기 노동자들이 다 죽었다면성..커널도 죽어버립니다. 구글링을 통해 봤는데요. 아마도 n_jobs > 1 이상인 경우 뜰 수 있다고 하는 것 같습니다.여기서 n_jobs가 scikit-learn api를 통해 보면 n_jobs : int or None, optional (default=None)Num.. 2018. 11. 30.