'2021/03 글 목록 Smelt Roe Sushi
728x90

2021/03 4

[Python] 범주형에 따라 그래프 나누어 그리기

범주형에 따라 그리드로 나누어 그래프를 나누어 한 번에 그리는 방법입니다. 캐글의 타이타닉 데이터를 이용하여 보여드리겠습니다. 각 그래프에 대한 설명은 생략하도록 하겠습니다. import pandas as pd import seaborn as sns train = pd.read_csv('train.csv') train.head() train['Survived'].value_counts() 0과 1로 이루어진 범주형 변수 'Survived'에 따라 연령대('Age')가 어떤지 히스토그램 그래프로 살펴보겠습니다. g = sns.FacetGrid(train, col='Survived') g.map(plt.hist, 'Age', bins=20) 또는, 남자/여자로 이루어진 범주형 변수 'Sex'에 따라 연령별 ..

카테고리 없음 2021.03.14

[Python] 결측치 시각화 missingno

캐글의 타이타닉 train 데이터를 불러와서 구조를 살펴본 뒤, 시각화를 통해 결측값이 있는 컬럼을 알아보겠습니다. train = pd.read_csv('train.csv') train.info() 구조에서도 알 수 있듯이 전체 891행 중에 Age와 Cabin, Embarked에 결측치가 존재하는 것을 확인할 수 있습니다. 시각화로 표현해보겠습니다. import missingno as msno msno.matrix(train, figsize=(12,5) matrix 그래프 외에 bar chart나 heatmap 등으로도 표현이 가능합니다~

[Python] 사이킷런 결측치 대체 함수 SimpleImputer

from sklearn.preprocessing import Imputer가 from sklearn.impute import SimpleImputer 로 바뀌었습니다. from sklearn.preprocessing import SimpleImputer SimpleImputer(missing_values, strategy, fill_value, verbose, copy, add_indicator) 주요 파라미터 missing_values - 데이터에서의 결측치 값 - default는 nan - 만약 결측치 값이 -1이라면 missing_values=-1 strategy - 결측치를 대체할 방법 - 예: mean, median, most_frequent, constant... fill_value - str..

주피터 노트북 초기 실행 폴더 경로 변경하기

주피터 노트북을 실행하면 시작 폴더 위치가 마음에 들지 않고 작업할 때 불편함을 겪을 때가 있습니다. 그래서 초기 실행 폴더 경로를 변경해주고자 합니다. 주피터 노트북을 실행할 때, anaconda prompt 보시면 초기 실행 위치가 뜨네요 (하얀부분은 제 개인정보라..^^) 1. Anaconda Prompt창에서 config파일 생성하기 아나콘다 프롬프트창을 열어서 다음과 같이 입력해줍니다 jupyter notebook --generate-config 2. 생성된 config파일 열기 생성된 jupyter_notebook_config 파일을 열어줍니다. 저는 우클릭해서 "Edit with IDLE" 선택하여 파이썬 IDLE로 열어주었습니다. 메모장으로 열어도됩니다. 그럼 아래 파란박스친 부분처럼 주석..

카테고리 없음 2021.03.11