728x90
캐글의 타이타닉 train 데이터를 불러와서 구조를 살펴본 뒤, 시각화를 통해 결측값이 있는 컬럼을 알아보겠습니다.
train = pd.read_csv('train.csv')
train.info()
구조에서도 알 수 있듯이 전체 891행 중에 Age와 Cabin, Embarked에 결측치가 존재하는 것을 확인할 수 있습니다.
시각화로 표현해보겠습니다.
import missingno as msno
msno.matrix(train, figsize=(12,5)
matrix 그래프 외에 bar chart나 heatmap 등으로도 표현이 가능합니다~
728x90
'데이터 분석 > [Python] 기초' 카테고리의 다른 글
[Python] 두 리스트 안에 유니크한 값 찾기 (0) | 2021.07.12 |
---|---|
[python] 코드 실행시간 측정하기 (0) | 2021.05.04 |
[Python] np.where 조건에 맞는 값 변경 (0) | 2021.02.04 |
[Python] read_csv 필요한 컬럼만 불러오기 (0) | 2020.12.04 |
[Python] matplotlib 한글 출력 (0) | 2020.12.04 |