-
COVID-19 ( 4 - 데이터 전처리 )데이터 분석/코로나19 2021. 2. 6. 14:11
이전에는 기존의 데이터프레임에 있는 내용을 바꿨다면 이번에는 기존의 데이터프레임의 있는 내용을 가지고 새로운 컬럼을 생성하며 앞으로의 분석 방향을 확장하는 과정이다.
-> 기존처럼 ipynb파일을 이용하지않고 만들었던 csv파일을 이용해 데이터프레임을 불러왔다. 여기서 처음에 생각했던 여러가지 생각 중 하나인 ' 연휴가 끝난 뒤에 확진자가 증가하는게 사실일까? ', ' 주말에는 진짜 확진자 수가 줄어드나?'를 확인하기위해 월별, 주차별 확진 정보를 알고싶었다.
-> 퇴원현황 이라는 컬럼의 이름을 조치상황으로 바꾸는게 더 적합하다고 생각해 컬럼명을 바꿔주었다.
-> 월별, 주차별 확진 정보를 알기 전에 "확진일" 컬럼을 datetime형태로 바꿔주어야 한다.
-> datetime 형태로 바꾼 "확진일" 컬럼을 이용해 "년월","년월일","월","주","년주" 컬럼을 새로 만들었다.
-> 새로만든 컬럼들을 만들 때 방식을 모두 같은 방식으로 하기보다는 모두 다르게 하였다.
-> 자세한 내용은 해당 주소를 참고하면 좋다. https://wikidocs.net/46998
위키독스
온라인 책을 제작 공유하는 플랫폼 서비스
wikidocs.net
-> 새로 만들어진 컬럼을 기존에 데이터프레임에 추가해주었다.
'데이터 분석 > 코로나19' 카테고리의 다른 글
COVID-19 ( 7 - 분석 및 검증) (0) 2021.02.11 COVID-19 ( 5 - 분석 및 검증) (0) 2021.02.08 COVID-19 ( 3 - 데이터 전처리 ) (0) 2021.02.06 COVID-19 ( 2 - 데이터 크롤링 ) (0) 2021.02.06 COVID-19 (1) (0) 2021.02.05