본문 바로가기

파이썬/프로젝트

(2)
파이썬 프로젝트 - 데이터셋을 활용한 다이아몬드 가격 예측 #파이썬 프로젝트 1. 문제 정의 다이아몬드의 가격을 결정하는 요소는 다양하다. 그렇기에 소비자는 다이아몬드의 가격을 알기가 어려운데 이에 도움을 줄 수 있는 AI를 만들자(가상으로 설정한 내용입니다) 2. 데이터 탐색 캐글의 Diamonds Price Dataset 활용 https://www.kaggle.com/datasets/amirhosseinmirzaie/diamonds-price-dataset 3. 데이터 확인 (1) Head() 함수 데이터 안에는 흔히 알고 있는 '캐럿', '색', '커팅정도' 외에도 'depth'나 'x', 'y', 'z' 등 일반인이 잘 사용하지 않는 데이터들이 있었다. (2) info() 함수 null 값은 없음을 확인하였다. 4. 데이터 전처리 우선 일반인들이 쉽게 고..
파이썬 프로젝트 - 지하철 승객 분석 #공공데이터 분석 1. 데이터 탐색 데이터를 제공하는 사이트 'kaggle', '공공데이터포털', 각종 지자체 사이트에서 필요한 데이터를 내려받을 수 있다. 공공데이터포털(https://www.data.go.kr/data/3057229/fileData.do)에 있는 '부산교통공사_시간대별 승하차인원' 데이터를 사용하였다. 2. 데이터 정보 (1) head() 'head'함수를 통해 해당 데이터가 역번호-역명-날짜-요일-승-하차-시간... 순으로 이루어짐을 확인하였다. 그 외에도 해당 데이터는 1호선 ~ 4호선까지, 한달 단위로 나누어져 총 6개월치의 내용이 있다. (2) info(), describe() 3. 데이터 전처리 (1) 1호선 데이터만 사용할 예정이므로 2호선부터는 삭제한다. 원본 데이터 =>..