jupyter notebook 데이터 전체 출력하기 import pandas as pd pd.set_option('display.max_columns',None) # 전체 열 출력하기 pd.set_option('display.max_rows',None) # 전체 행 출력하기 데이터 분석/[Python] 기초 2022.01.25
[python] Series에 값 구하기 get_values(), to_numpy() sido 라는 데이터프레임에서 sido_nm(시도명)이 "인천광역시"인 sido_ind(시도 번호)를 찾고 싶다. sido[sido['sido_nm']=="인천광역시"]['sido_ind'] 이렇게 Series 형태로 반환이 되고, 이때 원하는 '3'이라는 sido_ind(시도 번호)를 얻기 위해서 get_values()를 호출하면 됩니다. sido[sido['sido_nm']=="인천광역시"]['sido_ind'].get_values() # array(['3'], dtype=object) sido[sido['sido_nm']=="인천광역시"]['sido_ind'].get_values()[0] # '3' 그런데 버전에 따라서 get_values()가 안 되는 경우가 있는데, 이때는 to_numpy()로 .. 데이터 분석/[Python] 기초 2021.11.05
[Python] DataFrame 행 삭제 (1) index 순서 df = df.drop([df.index[5]]) # 5번째 인덱스(행) 삭제 df = df.drop([df.index[5], df.index[7]]) # 5, 7번째 인덱스(행) 삭제 (2) index 이름 df = df.drop(['A', 'B']) # 인덱스명이 'A'와 'B'인 행 삭제 (3) 조건에 맞는 행 삭제 idx = df[df['지역'] == "서울"].index # '지역'이 '서울'인 행들의 인덱스 추출 df = df.drop([idx]) 데이터 분석/[Python] 기초 2021.09.08
[Python] groupby 컬럼명 df_g = df.groupby('등록공장ID')['표제부PK'].count() #등록공장ID별 표제부PK의 개수 print(df_g) 등록공장ID가 index로 잡혀있고, 표제부PK 컬럼에 count 개수가 있습니다. 이때, reset_index( )를 해주면 index가 빠져나오게 되겠죠 df_g = df.groupby('등록공장ID')['표제부PK'].count().reset_index() print(df_g) count 값의 내용을 포함하는 표제부PK 컬럼 이름을 바꾸고싶다면 reset_index(name='컬럼명')을 해주면 됩니다. df_g = df.groupby('등록공장ID')['표제부PK'].count().reset_index(name='표제부PK개수') print(df_g) 데이터 분석/[Python] 기초 2021.08.05
[Python] dataframe apply lambda 다중 컬럼 적용 result['buff'] = result.apply(lambda x : x['bound'].buffer(x['length'], join_style=2)) # KeyError ('EMD_CD', 'occurred at index count') result['buff'] = result.apply(lambda x : x['bound'].buffer(x['length'], join_style=2), axis=1) # default axis=0 데이터 분석/[Python] 기초 2021.07.12
[Python] read_csv 필요한 컬럼만 불러오기 불러오고자 하는 데이터 안에 여러 개의 컬럼 중에 필요한 컬럼만 불러올 때 col = [0,37] # 0번째와 37번째 컬럼 df = pd.read_csv("데이터.txt", usecols = col) # 다른 파라미터는 생략함 데이터 분석/[Python] 기초 2020.12.04
[Python] 컬럼 순서 바꾸기 # 컬럼 목록 가져오기 cols = list(df.columns.values) # ['가', '나', '다', '라'] # 컬럼 순서 바꾸기 (1) - 직접 컬럼명을 입력하여 바꾸기 df = df[['라', '다', '나', '가']] # 컬럼 순서 바꾸기 (2) - 순서 지정하여 바꾸기 df = df[df.columns[4,3,2,1]] 데이터 분석/[Python] 기초 2020.09.08