728x90
from sklearn.preprocessing import Imputer가 from sklearn.impute import SimpleImputer 로 바뀌었습니다.
from sklearn.preprocessing import SimpleImputer
SimpleImputer(missing_values, strategy, fill_value, verbose, copy, add_indicator)
주요 파라미터
missing_values
- 데이터에서의 결측치 값
- default는 nan
- 만약 결측치 값이 -1이라면 missing_values=-1
strategy
- 결측치를 대체할 방법
- 예: mean, median, most_frequent, constant...
fill_value
- strategy에서 constant로 설정했다면 대체할 상수값 입력
- default는 0
# -1의 결측치값을 평균값으로 대체하기
mean_imp = SimpleImputer(missing_values=-1, strategy='mean')
train['wind'] = mean_imp.fit_trainsform(train[['wind']]).ravel()
728x90
'데이터 분석 > [Python] 머신러닝' 카테고리의 다른 글
surprise 추천 알고리즘 (0) | 2022.01.05 |
---|---|
XGBoost 이해하기 (0) | 2022.01.05 |