[Python] 결측치 시각화 missingno

데이터 분석/[Python] 기초

[Python] 결측치 시각화 missingno

INCHELIN 2021. 3. 14. 18:41
728x90

캐글의 타이타닉 train 데이터를 불러와서 구조를 살펴본 뒤, 시각화를 통해 결측값이 있는 컬럼을 알아보겠습니다.

train = pd.read_csv('train.csv')
train.info()

구조에서도 알 수 있듯이 전체 891행 중에 Age와 Cabin, Embarked에 결측치가 존재하는 것을 확인할 수 있습니다.

시각화로 표현해보겠습니다.

 

import missingno as msno
msno.matrix(train, figsize=(12,5)

matrix 그래프 외에 bar chart나 heatmap 등으로도 표현이 가능합니다~

728x90