'dataframe' 태그의 글 목록
728x90

dataframe 8

[python] Series에 값 구하기 get_values(), to_numpy()

sido 라는 데이터프레임에서 sido_nm(시도명)이 "인천광역시"인 sido_ind(시도 번호)를 찾고 싶다. sido[sido['sido_nm']=="인천광역시"]['sido_ind'] 이렇게 Series 형태로 반환이 되고, 이때 원하는 '3'이라는 sido_ind(시도 번호)를 얻기 위해서 get_values()를 호출하면 됩니다. sido[sido['sido_nm']=="인천광역시"]['sido_ind'].get_values() # array(['3'], dtype=object) sido[sido['sido_nm']=="인천광역시"]['sido_ind'].get_values()[0] # '3' 그런데 버전에 따라서 get_values()가 안 되는 경우가 있는데, 이때는 to_numpy()로 ..

[Python] groupby 컬럼명

df_g = df.groupby('등록공장ID')['표제부PK'].count() #등록공장ID별 표제부PK의 개수 print(df_g) 등록공장ID가 index로 잡혀있고, 표제부PK 컬럼에 count 개수가 있습니다. 이때, reset_index( )를 해주면 index가 빠져나오게 되겠죠 df_g = df.groupby('등록공장ID')['표제부PK'].count().reset_index() print(df_g) count 값의 내용을 포함하는 표제부PK 컬럼 이름을 바꾸고싶다면 reset_index(name='컬럼명')을 해주면 됩니다. df_g = df.groupby('등록공장ID')['표제부PK'].count().reset_index(name='표제부PK개수') print(df_g)