'Python' 태그의 글 목록 (7 Page)
728x90

Python 74

[Python] 범주형에 따라 그래프 나누어 그리기

범주형에 따라 그리드로 나누어 그래프를 나누어 한 번에 그리는 방법입니다. 캐글의 타이타닉 데이터를 이용하여 보여드리겠습니다. 각 그래프에 대한 설명은 생략하도록 하겠습니다. import pandas as pd import seaborn as sns train = pd.read_csv('train.csv') train.head() train['Survived'].value_counts() 0과 1로 이루어진 범주형 변수 'Survived'에 따라 연령대('Age')가 어떤지 히스토그램 그래프로 살펴보겠습니다. g = sns.FacetGrid(train, col='Survived') g.map(plt.hist, 'Age', bins=20) 또는, 남자/여자로 이루어진 범주형 변수 'Sex'에 따라 연령별 ..

카테고리 없음 2021.03.14

[Python] 결측치 시각화 missingno

캐글의 타이타닉 train 데이터를 불러와서 구조를 살펴본 뒤, 시각화를 통해 결측값이 있는 컬럼을 알아보겠습니다. train = pd.read_csv('train.csv') train.info() 구조에서도 알 수 있듯이 전체 891행 중에 Age와 Cabin, Embarked에 결측치가 존재하는 것을 확인할 수 있습니다. 시각화로 표현해보겠습니다. import missingno as msno msno.matrix(train, figsize=(12,5) matrix 그래프 외에 bar chart나 heatmap 등으로도 표현이 가능합니다~

[Python] np.where 조건에 맞는 값 변경

np.where(조건, True일 때의 값, False일 때의 값) import numpy as np import pandas as pd df = pd.read_csv("인천_행정구역현황.csv", encoding="949") # 인천광역시 남구는 과거 2018년에 미추홀구로 명칭이 변경되어 해당 내용을 바꾸려고 합니다. df['주소'] = np.where(df['주소'] == "인천광역시 남구", "인천광역시 미추홀구", df['주소']) # df['주소']가 '인천광역시 남구'에 해당(True)하면, "인천광역시 미추홀구"로 바꾸고 # 해당하지 않으면(False) 그대로 df['주소'] 의 내용을 남긴다.

XGBoost 설치 에러

XGBoost 설치는 아나콘다 환경에서 쉽게 설치가 가능합니다. Windows 기반에서 설치하려면 아나콘다 command 창에서 아래와 같이 명령어를 입력하면 됩니다. conda install -c anaconda py-xgboost 무슨 일인지 에러가 나는데 읽어보니 버전 오류인 것 같네요 1. xgboost package 다운받기 https://www.lfd.uci.edu/~gohlke/pythonlibs/ 위의 사이트에 들어가서 'xgboost'라고 검색하여 본인 python 버전과 컴퓨터 사양에 맞는 whl파일을 다운 받습니다. 저의 경우 python 3.8이고 윈도우 64bit라서 사진에 밑줄 친 파일을 다운 받았고, 폴더(C:\Users\Administrator\anaconda3\Lib\sit..

[Python] matplotlib 한글 출력

import matplotlib.pyplot as plt import seaborn as sns import matplotlib %matplotlib inline import platform path = '/Library/Fonts/NanumSquareRegular.ttf' # 개인 컴퓨터에 글꼴 경로에 맞게 설정!! from matplotlib import font_manager, rc if platform.system() == "Darwin": rc('font', family = 'AppleGothic') elif platform.system() == 'Windows': font_name = font_manager.FontProperties(fname=path).get_name() rc('font',..

ModuleNotFoundError: No module named 'MySQLdb'

다음과 같은 방법으로 데이터베이스에 연결해보지만 에러가 나는 경우가 있습니다. import pymysql from sqlalchemy import create_engine engine = sqlalchemy.create_engine('mysql://') ModuleNotFoundError: No module named 'MySQLdb' 이럴 경우, 다음과 같이 수정해서 실행해보니 에러없이 실행이 될 수 있습니다 :) engine = sqlalchemy.create_engine('mysql+pymysql://')