본문 바로가기

## 오래된 게시글 (미관리) ##/R47

27. 정형 데이터마이닝 - 연관성 분석(Association Analysis) 안녕하세요.오늘은 연관성 분석에 대해서 알아볼게요! #연관성 분석​연관성 분석은 동시 또는 순차적으로 발생하는 이벤트 패턴을 파악하는 방법으로 구매나 사건의 발생에 대한 패턴분석을 하는 데 사용됩니다. 이를 이용해서 상품추천에 사용할 수 있습니다. 요즘 실시간이 중요하다고 하는데, 사실 실시간 추천엔진이 실시간으로 분석을 해서 유의미한 변화를 감지할 정도로추천의 변화가 매우 짧은 초단위, 분단위로 이루어지지 않는다고 합니다. 따라서 모델링과 결과값을 비즈니스적인 업무주기에 맞추어 일, 주, 월단위로 실행해도 된다고 합니다. 이제 연관성 분석이 무엇인지 알아볼게요~ #연관성 분석이란? -데이터 간의 관계에서 조건과 반응을 연결하는 분석으로 장바구니 분석(Market Basket Analysis), 혹은 서.. 2018. 11. 21.
26. 정형 데이터마이닝 - 군집분석(Clustering) 안녕하세요. 이번 시간에는 군집분석 (Clustering) 에 대해서 알아보도록 하겠습니다. 군집분석은 분류예측과 같이 타겟 값은 없는 데이터에서,데이터 특성에 따라 집단을 분리하는 방식으로 거리를 측정하여 집단의 이질성과 동질성을 평가하여 그룹화한다.이질성으로 거리를 산출하고, 동질성으로 묶음으로서 집단을 구분하고, 집단을 구분하는데 사용된 변수들의 집단 간 차이를 통해 profiling 하여 데이터에 대한 구조적인 특성을 파악한다. 이런 방식을 데이터에 대해 이해하지 못하는 상태에서 시도를 하면 전체적인 데이터가 어떻게 구성되어 있는지 쉽게 파악할 수 있다. 1.정의 # 관찰 대상에 대해 수집된 정보를 이용해 유사한 특성을 가진 그룹으로 나누어 집단의 특성을 도출하는 기법 2. 분석 목적 -각 집단의.. 2018. 11. 21.
25. 정형 데이터마이닝 - 예측 분석(Prediction) 안녕하세요. 오늘은 정형데이터마이닝의 두 번째 파트, 예측분석에 대해서 알아보도록 하겠습니다. 예측분석은 분류예측 방식을 연속형 값에 적용하는데 회귀분석과는 달리 연속적인 값을 하나하나 예측하는 것이 아니라, 집단별로 평균값을 예측합니다. 저번시간에 이어서 party패키지를 사용하므로 쭉 이어서 해도 되실 듯 합니당~ 1. 정의​# 관찰 대상의 변수를 이용하여 연속적인 값을 예측하는 분석으로 분류 분석이 범주를 예측하는데 비해 예측분석은 연속적인 수치를 예측한다.​# 활용 분야 : 금융기관 고객의 소득 수준, 자녀의 키 등 연속적인 결과 값에 대한 예측 ​2. party 패키지 분석 사례​classification의 사례에서 아래의 범주형 변환을 제외하고 실행하면 연속형으로 예측하게 된다.####ㅋㅋㅋㅋ.. 2018. 11. 21.
24. 정형 데이터마이닝 - 분류분석(Classification) ​안녕하세요. 이번 파트는 정형 데이터마이닝 - 분류분석에 대해서 알아보고자 합니다.분류분석을 바로 알아보기에 앞서, 정형 데이터마이닝에 어떤 것이 있는가 부터 차근히 알아가볼께요.. 정형 데이터마이닝 학습? 분석기법으로 활용도가 가장 높고, 지속적으로 주목받고 있는 데이터 마이닝 기법.모든 산업과 다양한 문제해결에 즉각적 적용이 가능한 내용들로 CRM 분야에서 많이 사용되었으며, 빅데이터 시대에 더욱 각광받고 있다.비정형 데이터와 정형 데이터 결합까지 고려하면 활용도가 매우 높아 깊이 있게 파악해야할 내용이다. 데이터마이닝의 개념과 분류? ​개념 : 데이터 마이닝(data mining)은 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 것 (위키피디아) 분류 : 1).. 2018. 11. 21.