ㅋㄷㅋㄷ Smelt Roe Sushi
728x90

전체 글 278

[Python] 결측치 시각화 missingno

캐글의 타이타닉 train 데이터를 불러와서 구조를 살펴본 뒤, 시각화를 통해 결측값이 있는 컬럼을 알아보겠습니다. train = pd.read_csv('train.csv') train.info() 구조에서도 알 수 있듯이 전체 891행 중에 Age와 Cabin, Embarked에 결측치가 존재하는 것을 확인할 수 있습니다. 시각화로 표현해보겠습니다. import missingno as msno msno.matrix(train, figsize=(12,5) matrix 그래프 외에 bar chart나 heatmap 등으로도 표현이 가능합니다~

[Python] 사이킷런 결측치 대체 함수 SimpleImputer

from sklearn.preprocessing import Imputer가 from sklearn.impute import SimpleImputer 로 바뀌었습니다. from sklearn.preprocessing import SimpleImputer SimpleImputer(missing_values, strategy, fill_value, verbose, copy, add_indicator) 주요 파라미터 missing_values - 데이터에서의 결측치 값 - default는 nan - 만약 결측치 값이 -1이라면 missing_values=-1 strategy - 결측치를 대체할 방법 - 예: mean, median, most_frequent, constant... fill_value - str..

주피터 노트북 초기 실행 폴더 경로 변경하기

주피터 노트북을 실행하면 시작 폴더 위치가 마음에 들지 않고 작업할 때 불편함을 겪을 때가 있습니다. 그래서 초기 실행 폴더 경로를 변경해주고자 합니다. 주피터 노트북을 실행할 때, anaconda prompt 보시면 초기 실행 위치가 뜨네요 (하얀부분은 제 개인정보라..^^) 1. Anaconda Prompt창에서 config파일 생성하기 아나콘다 프롬프트창을 열어서 다음과 같이 입력해줍니다 jupyter notebook --generate-config 2. 생성된 config파일 열기 생성된 jupyter_notebook_config 파일을 열어줍니다. 저는 우클릭해서 "Edit with IDLE" 선택하여 파이썬 IDLE로 열어주었습니다. 메모장으로 열어도됩니다. 그럼 아래 파란박스친 부분처럼 주석..

카테고리 없음 2021.03.11

[Python] np.where 조건에 맞는 값 변경

np.where(조건, True일 때의 값, False일 때의 값) import numpy as np import pandas as pd df = pd.read_csv("인천_행정구역현황.csv", encoding="949") # 인천광역시 남구는 과거 2018년에 미추홀구로 명칭이 변경되어 해당 내용을 바꾸려고 합니다. df['주소'] = np.where(df['주소'] == "인천광역시 남구", "인천광역시 미추홀구", df['주소']) # df['주소']가 '인천광역시 남구'에 해당(True)하면, "인천광역시 미추홀구"로 바꾸고 # 해당하지 않으면(False) 그대로 df['주소'] 의 내용을 남긴다.

XGBoost 설치 에러

XGBoost 설치는 아나콘다 환경에서 쉽게 설치가 가능합니다. Windows 기반에서 설치하려면 아나콘다 command 창에서 아래와 같이 명령어를 입력하면 됩니다. conda install -c anaconda py-xgboost 무슨 일인지 에러가 나는데 읽어보니 버전 오류인 것 같네요 1. xgboost package 다운받기 https://www.lfd.uci.edu/~gohlke/pythonlibs/ 위의 사이트에 들어가서 'xgboost'라고 검색하여 본인 python 버전과 컴퓨터 사양에 맞는 whl파일을 다운 받습니다. 저의 경우 python 3.8이고 윈도우 64bit라서 사진에 밑줄 친 파일을 다운 받았고, 폴더(C:\Users\Administrator\anaconda3\Lib\sit..

[Python] matplotlib 한글 출력

import matplotlib.pyplot as plt import seaborn as sns import matplotlib %matplotlib inline import platform path = '/Library/Fonts/NanumSquareRegular.ttf' # 개인 컴퓨터에 글꼴 경로에 맞게 설정!! from matplotlib import font_manager, rc if platform.system() == "Darwin": rc('font', family = 'AppleGothic') elif platform.system() == 'Windows': font_name = font_manager.FontProperties(fname=path).get_name() rc('font',..