'Python' 태그의 글 목록 (2 Page)
728x90

Python 74

[Kaggle] Airbnb New User Bookings - (1) 데이터확인

Airbnb New User Bookings | Kaggle 2015년에 캐글에서 진행한 airbnb 프로젝트를 가지고 데이터 분석, 모델링하는 과정을 작성해보려고 한다. [Overview] 새로 가입한 유저가 처음 여행을 예약할 나라를 예측 [Dataset Description] demographics, web session records, and some summary statistics train_users.csv / test_users.csv 컬럼명 설명 예시 id 유저 ID gxn3p5htnn data_account_created 가입일자 2010-06-28 timestamp_first_active 처음 활동 날짜 20090319043255 date_first_booking 첫 예약 날짜 NaN..

[python] pyspark 집계함수

count count(컬럼명) : null 미포함 count(*) : null 포함 from pyspark.sql.functions import count df.select(count('colname')).show() countDistinct countDistinct(컬럼명) : 고유 레코드 수의 카운트 from pyspark.sql.functions import countDistinct df.select(countDistinct('colname')).show() first / last first(컬럼명) : 첫 번째 값 last(컬럼명) : 마지막 값 from pyspark.sql.functions import first, last df.select(first('colname'), last('colna..

CondaHTTPError: HTTP 000 CONNECTION FAILED

패키지를 설치하려고 했더니 다음과 같은 에러메세지가 뜨며 설치를 실패했다! Collecting package metadata (current_repodata.json): failed CondaHTTPError: HTTP 000 CONNECTION FAILED for url Elapsed: - An HTTP error occurred when trying to retrieve this URL. HTTP errors are often intermittent, and a simple retry will get you on your way. If your current network has https://www.anaconda.com blocked, please file a support request with..

[python] plot axis 지수 포맷팅

x축 그래프가 과학적 표기로 1e6으로 되어있는 것을 일반적인 숫자로 변형하기 plt.ticklabel_format(axis='x',useOffset=False, style='plain') 참고 https://kongdols-room.tistory.com/84 축(axes,axis)의 포맷팅(눈금(틱,tick), 축제목(레이블,label)) - matplotlib(9) 파이썬 버전 3.7 기준 matplotlib 버전 3.0.3 기준 축(axes,axis)의 포맷팅(틱(tick), 축제목(레이블,label)) 본 포스팅에서는 플롯에서 축의 틱과, 축 제목을 편집하는 방법에 대해 다룬다. 관련된 함수 kongdols-room.tistory.com

[python] 가상환경 생성

1. cmd 명령어 입력 1) cmd창 실행하여 명령어 입력 python -m venv /가상환경폴더경로 2) 명령어를 입력하면 해당폴더에 Scripts, Lib 등의 하위폴더로 구성되어 있음 3) 해당 경로에서 가상환경 활성화 2. anaconda navigator에서 생성 1) anaconda navigator 실행 2) Environments > Create > Create new environment 원하는 가상환경 이름과 파이썬 버전을 선택하여 생성하기 3) 가상환경 활성화하기 - 아나콘다 네비게이터에서 생성한 가상환경을 클릭하거나, - 아나콘다 프롬프트 창에서 conda activate 가상환경이름 입력하기 (아래 링크 참고) https://code-code.tistory.com/81 [pyt..

[빅분기/후기] 빅분기 2회 합격후기

어느새 빅분기 3회 접수 시즌이 다가왔고 곧있으면 3회 필기가 있네요~ 작년에 1회 준비를 하고 있다가 일주일 전쯤에 코로나19로 취소된다는 소식을 듣고 공부해둔 게 아까웠던 기억이 나네요 1) 빅데이터분석기사 접수 사이트 https://www.dataq.or.kr/www/main.do 데이터자격시험 카드결제/계좌이체 환불 환불 요청시 즉시환불 www.dataq.or.kr 2) 응시자격 응시자격은 아래와 같고, 필기 합격한 사람에 한해 필기 발표나는 날부터 관련 서류를 업로드 하시면 됩니다~ 자세한 사항이나 궁금하신 점은 직접 문의하시거나 제가 참고했던 네이버 카페들(밑에서 이야기할 예정) 에서 찾아보시면 나올 것 같네요! 3) 합격기준 필기는 총 4과목으로 20개 문항씩 출제됩니다. 모두 객관식이구요 ..