'데이터 분석/[Python] 머신러닝' 카테고리의 글 목록
728x90

데이터 분석/[Python] 머신러닝 3

surprise 추천 알고리즘

surprise 패키지 설치 $ pip install scikit-surprise $ conda install -c conda-forge scikit-surprise surprise 추천 알고리즘 클래스 - SVD : 행렬 분해를 통한 잠재 요인 협업 필터링을 위한 SVD 알고리즘 - KNNBasic : 최근접 이웃 협업 필터링을 위한 KNN 알고리즘 - BaselineOnly : 사용자 Bias와 아이템 Bias를 감안한 SGD 베이스라인 알고리즘 - SVD++, NMF 등등... 출처 : 파이썬 머신러닝 완벽가이드(권철민) 참고 http://surprise.readthedocs.io/en/stable prediction_algorithms package — Surprise 1 documentation..

XGBoost 이해하기

XGBoost란? eXtra Gradient Boost의 약자 트리 기반의 앙상블 학습에서 각광받고 있는 알고리즘 중 하나 CPU 환경에서 병렬 학습이 가능해 GBM보다 빠름 분류와 회귀 모두 가능 파이썬 패키지명 "xgboost" XGBoost 장점 뛰어난 예측 성능 GBM 대비 빠른 수행 속도(대표적으로 조기 중단, Early Stopping 기능이 있음) 과적합 규제(Regularization) 자체적으로 교차 검증, 성능 평가, 피쳐 중요도 등의 시각화 기능이 있음 XGBoost 주요 하이퍼 파라미터 (사이킷런 x) eta [default=0.3, alias: learning_rate] : 학습률 num_boost_rounds : n_estimators와 같은 파라미터 min_child_weigh..

[Python] 사이킷런 결측치 대체 함수 SimpleImputer

from sklearn.preprocessing import Imputer가 from sklearn.impute import SimpleImputer 로 바뀌었습니다. from sklearn.preprocessing import SimpleImputer SimpleImputer(missing_values, strategy, fill_value, verbose, copy, add_indicator) 주요 파라미터 missing_values - 데이터에서의 결측치 값 - default는 nan - 만약 결측치 값이 -1이라면 missing_values=-1 strategy - 결측치를 대체할 방법 - 예: mean, median, most_frequent, constant... fill_value - str..