VERTICA/10.Machine Learning
-
CausalImpact(버티카와 연동)VERTICA/10.Machine Learning 2018. 10. 1. 18:38
- 실험데이터가아닌 자연관찰자료(A/B 테스팅과 다름) 마케팅이 아닌 다른 외부적 사건들, 예를 들어서 배송 최소 구매액을 올린다던지 경쟁사가 마케팅을 하는 경우에도 이런 외부의 사건들이 우리 실적에 미치는 영향을 A/B 테스팅으로 알아낼 수는 없음. xxx 동영상이 조회수가 올라가는 경우에도 A/B테스팅으로 알수 없음 - 두 시점이 아닌 여러 시점의 자료 처리(시계열 분석) A/B 테스팅처럼 처치 전 처치 후와 같은데이터가 아닌 여러시점의 데이터를 처리할 수 있다. - 다양한 독립변수 예를들어 매출 혹은 클릭율에 대한 종속변수를 설명하기위한 여러가지 변수를 동시에 사용할 수 있음. - 변수 선택 어떤 변수가 중요한가를 선별해주는 장점이 있음 - local trend, seasonal effect loc..
-
머신러닝 관련 기능들VERTICA/10.Machine Learning 2017. 9. 6. 17:41
머신러닝 관련 기능들 (8.1이전 버전에서는 몇 가지 기능이 없을 수 있습니다.) 데이터 준비 기능데이터를 사전 처리하기 위해 다음과 같은 기능을 사용할 수 있습니다 :APPLY_NORMALIZEBALANCE DETECT_OUTLIERS IMPUTE NORMALIZE NORMALIZE_FITREVERSE_NORMALIZE 평가 기능데이터를 평가하기 위해 다음과 같은 기능을 사용할 수 있습니다 :APPLY_KMEANSCONFUSION_MATRIXGET_MODEL_ATTRIBUTEERROR_RATELIFT_TABLEMSEROCRSQUAREDSUMMARIZE_MODEL 예측 기능테이블에 모델을 적용하기 위해 다음과 같은 기능을 사용할 수 있습니다 :PREDICT_LINEAR_REGPREDICT_LOGISTIC..
-
Vertica 에서 Kmeans 수행하기VERTICA/10.Machine Learning 2016. 12. 27. 18:56
K-평균 알고리즘(K-means algorithm)은 주어진 데이터를 k개의 클러스터로 묶는 알고리즘으로, 각 클러스터와 거리 차이의 분산을 최소화하는 방식으로 동작한다. 이 알고리즘은 자율 학습의 일종으로, 레이블이 달려 있지 않은 입력 데이터에 레이블을 달아주는 역할을 수행한다. (위키백과 참조 : https://ko.wikipedia.org/wiki/K-%ED%8F%89%EA%B7%A0_%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98 ) 실습대상데이터 iris 아이리스는 붓꽃에 대한 꽃받침,꽃잎의(길이,너비) 정보 데이터가 들어있다. 꽃받침과 꽃잎이 무었인지 아리까리하다면.. 여기에서 잠깐확인하시거나 포털검색을.. -> http://withbook.tistory.com/426 ir..