본문 바로가기

분류 전체보기141

6. Python - 머신러닝에 앞서서 오늘은 데이터 탐색에 대해 공부해 보려고 합니당.먼저 *파이프라인에 대해 알아보도록 할게요. 데이터 처리를 할 때 특히 머신러닝을 할 때에는 파이프라인을 많이 사용한다고 하는데요, 파이프라인이란? 데이터 처리 컴포넌트(Component)들이 연속되어 있는 것을 파이프라인이라고 합니다.머신러닝 시스템은 데이터를 조작하고 변환할 일이 많기 때문입니다.보통 컴포넌트들은 비동기적으로 동작하고, 각 컴포넌트는 많은 데이터를 추출해 처리하고 그 결과를 다른 데이터 저장소로 보냅니다.그러면 일정 시간 후, 파이프라인의 다음 컴포넌트가 그 데이터를 추출해 자신의 출력 결과를 만드는 식입니다.따라서 각 컴포넌트는 완전히 독립적이고, 각 컴포넌트 사이의 인터페이스는 데이터 저장소 뿐이라고 합니다.그래서 시스템을 이해하기 .. 2018. 11. 23.
5. Python - Anaconda 설치 안녕하세요. 오랜만에 글을 남기게 되네요.취업이란 정말 어려운 것 같습니다요 ㅎㅎ;특히나 데이터 분석가로서 비전공자에 학사학위로 시작한다는 것. 정말 문이 좁게 느껴지네요. 아니면 제가 소설을 못쓰던지.... 하지만 안주하지 않고, 새롭게 이제 머신러닝 서적 을 바탕으로 포스팅 시작하겠습니다.여러분은 저처럼 고생 안하고 .. 데이터 분석가가 되시려면.. 공부 열심히 하시고..ㅠㅠ 통계학과 나오시고.. 석사정도는 따주시고.. 경험 쌓고.. 수상도 하고요.. 자격증도 따고.. 하시면 될 것 같네요 ㅋㅋㅋㅋ 헉 일단 이 글을 보고 계신분이 비전공자라면 저 정도는 기본으로 따도 힘들 것 같아요. 하지만 저도 노력하고 있으니 화이팅 아무래도 파이썬을 사용하는 방법은 여러 가지가 있을 텐데요. Java를 이용한 P.. 2018. 11. 23.
4. Python - 산술연산, 비교연산, 비트연산 등 바로 시작해볼까욤.. 1. 산술 연산: 산술 연산자는 숫자 자료형에서 덧셈(+), 뺄셈(-), 곱셈(*), 실수 나눗셈(/), 정수 나눗셈(//), 나머지(%), 거듭제곱(**) 등이 있습니다. 산술 연산자의 우선순위(priority)는 단항 연산자(부호 기호 +,-) , 거듭제곱, 곱셈과 나눗셈, 덧셈과 뺄셈 순서 입니다. 거듭제곱의 결합규칙은 오른쪽에서 왼쪽으로 적용하고, 나머지 연산자의 결합규칙은 왼쪽에서 오른쪽 순서로 계산합니다. 우선순위를 변경할 때는 괄호()를 사용합니다. ## 예제 1 >>> a=1+2 >>> b=1-2 >>> c=1*2 >>> d=1/2 >>> e=1//2 >>> f=1%2 >>> print('a:{0}, b:{1}, c:{2}, d:{3}, e:{4}. f:{5}'.for.. 2018. 11. 23.
3. Python - 불리안 연산, 숫자 자료형 안녕하세요 오늘은 불리안 연산에 대해 알아보고 숫자 자료형의 중간 부분까지만 알아보도록 할게요 1. 불리안불리안 자료형은 참 또는 거짓 값을 갖는 자료형으로, int클래스에서 상속받아 bool클래스로 구현되어 있습니다.False는 0 True는 1로 하여 정수 계산이 가능합니다. class bool([x])1. x가 생략되거나 거짓이면 False로 반환, 그렇지 않으면 TRUE2. int클래스의 자식 클래스(sub class, child class)이다. 2. 불리안 연산 불리안 연산자는 논리합(or), 논리곱(and), 부정(not)등이 있습니다. (1) [x or y] : if x is False then y else x (2) [x and y] : if x is False then x else y .. 2018. 11. 23.