[Python] 사이킷런 결측치 대체 함수 SimpleImputer

데이터 분석/[Python] 머신러닝

[Python] 사이킷런 결측치 대체 함수 SimpleImputer

INCHELIN 2021. 3. 14. 18:21
728x90

from sklearn.preprocessing import Imputer가 from sklearn.impute import SimpleImputer 로 바뀌었습니다.

from sklearn.preprocessing import SimpleImputer
SimpleImputer(missing_values, strategy, fill_value, verbose, copy, add_indicator)

 

주요 파라미터

missing_values

- 데이터에서의 결측치 값

- default는 nan

- 만약 결측치 값이 -1이라면 missing_values=-1

 

strategy

- 결측치를 대체할 방법

- 예: mean, median, most_frequent, constant...

 

fill_value

- strategy에서 constant로 설정했다면 대체할 상수값 입력

- default는 0

 

# -1의 결측치값을 평균값으로 대체하기

mean_imp = SimpleImputer(missing_values=-1, strategy='mean')
train['wind'] = mean_imp.fit_trainsform(train[['wind']]).ravel()

 

728x90

'데이터 분석 > [Python] 머신러닝' 카테고리의 다른 글

surprise 추천 알고리즘  (0) 2022.01.05
XGBoost 이해하기  (0) 2022.01.05