'데이터 분석/[Python] 기초' 카테고리의 글 목록 (2 Page)
728x90

데이터 분석/[Python] 기초 38

[python] 가상환경 생성

1. cmd 명령어 입력 1) cmd창 실행하여 명령어 입력 python -m venv /가상환경폴더경로 2) 명령어를 입력하면 해당폴더에 Scripts, Lib 등의 하위폴더로 구성되어 있음 3) 해당 경로에서 가상환경 활성화 2. anaconda navigator에서 생성 1) anaconda navigator 실행 2) Environments > Create > Create new environment 원하는 가상환경 이름과 파이썬 버전을 선택하여 생성하기 3) 가상환경 활성화하기 - 아나콘다 네비게이터에서 생성한 가상환경을 클릭하거나, - 아나콘다 프롬프트 창에서 conda activate 가상환경이름 입력하기 (아래 링크 참고) https://code-code.tistory.com/81 [pyt..

[python] Anaconda 패키지 관련 명령어 기초

conda base 가상환경 변경 conda activate 가상환경이름 설치된 패키지 및 버전 확인 conda list 특정 패키지 버전들 확인 conda search 패키지명 특정 패키지의 특정 버전으로 업그레이드(혹은 다운그레이드) conda install 패키지명=원하는 버전 conda install tensorflow=2.5 특정 패키지 최신 버전으로 업그레이드 conda update 패키지명

[python] conda install github packages

conda를 사용하여 github에 있는 패키지를 설치하기 제가 설치하려는 패키지는 한국어 전처리 패키지로 띄어쓰기 해주는 거고, 링크 참고 https://githubmemory.com/repo/haven-jeon/PyKoSpacing haven-jeon/PyKoSpacing - githubmemory Automatic Korean word spacing with Python githubmemory.com # conda 터미널 활성화 conda install git pip pip install git+https://github.com/haven-jeon/PyKoSpacing.git 터미널에서 conda list로 패키지가 정상적으로 설치되었는지 확인하거나 파이썬에서 import 해보면 됩니다~

[python] Series에 값 구하기 get_values(), to_numpy()

sido 라는 데이터프레임에서 sido_nm(시도명)이 "인천광역시"인 sido_ind(시도 번호)를 찾고 싶다. sido[sido['sido_nm']=="인천광역시"]['sido_ind'] 이렇게 Series 형태로 반환이 되고, 이때 원하는 '3'이라는 sido_ind(시도 번호)를 얻기 위해서 get_values()를 호출하면 됩니다. sido[sido['sido_nm']=="인천광역시"]['sido_ind'].get_values() # array(['3'], dtype=object) sido[sido['sido_nm']=="인천광역시"]['sido_ind'].get_values()[0] # '3' 그런데 버전에 따라서 get_values()가 안 되는 경우가 있는데, 이때는 to_numpy()로 ..

[python] 마크다운(markdown) 문법

1. 헤더(Header) # 개수에 따라 헤더의 크기가 달라집니다 (1개~6개) # Header ## Header ### Header #### Header ##### Header ###### Header 2. 목록 순서가 있는 것(숫자)과 없는 목록(*)으로 구분됩니다. - 순서가 있는 목록 1. 순서1 1. 순서2 1. 순서3 1. 순서4 2. 순서4 - 순서가 없는 목록 * 목록1 * 목록2 * 목록3 1. 순서 있음 * 순서 없음 * 같이 사용 * 가능 - 순서 있는 것과 없는 목록 같이 사용 계속 추가 예정..

[python] pivot 테이블

다음과 같이 주소와 건물에 대한 정보들이 있는 데이터프레임이 있습니다. 이를 피봇테이블로 만들어보겠습니다. pd.pivot_table(데이터프레임명, index = , column = , values = )로 표현되며, 많이들 엑셀에서 사용해봤을 텐데요 index는 축(범주), column은 범례(계열), values는 값에 해당합니다! pd.pivot_table(test, index='주소' , columns = '사용승인연도', values='총연면적').reset_index() 다음과 같은 피벗테이블 결과물을 확인해보실 수 있습니다.