-
COVID-19 ( 7 - 분석 및 검증)데이터 분석/코로나19 2021. 2. 11. 19:17
이번에는 21년 1월 31일까지 누적 확진자 수에 대해서 살펴보겠다.
-> 데이터프레임을 불러와 일별 확진자 수를 확인하였다.
-> 먼저 처음 확진자가 발생한 시점부터 21년 1월 31일까지 확진자가 발생하지 않은 날짜까지 모든 날짜를 불러왔다.
-> 데이터프레임 형식으로 변환하고 형변환을 거쳤다.
-> 확진일자에 맞는 확진자 수를 데이터 프레임 형식으로 만들었다.
-> 기존에 만들었더 확진일자와 확진수 데이터프레임을 merge( )를 통해 합쳤다. ( concat은 컬럼명이 같은 두 데이터프레임을 합치는 것으로 쉽게 표현하면 concat은 기존 데이터프레임 아래에 붙이는 형태이며 merge는 옆에 붙이는 개념이다. )
-> 누적된 수를 구하기위해서는 .cumsum( )을 사용해야하며, cumsum( )을 사용하여 확진 수가 더해지는 누적확진 수 컬럼을 새로 만들었다.
-> 확진수 컬럼과 누적확진수 컬럼을 이용한 시각화.
-> x축을 확진일자로 표현하여서 언제 확진자가 급증하였는지 확인할 수 있다. 하지만 누적 확진수가 워낙 많아 확진수 그래프는 상대적으로 변화가 없는 것처럼 보인다.
-> 확진수 컬럼을 따로 시각화한 결과 급증한 시기를 확인할 수 있다.
-> 누적확진수 시각화.
-> 월별로 어떤 요일에 가장 많은 확진자가 발생하였는지 보기위해 all_day 데이터프레임에서 '확진년월'과 '확진요일' 컬럼을 가져왔다.
-> 월별로 무슨 요일에 가장 많은 확진자가 발생하였는지 시각화 해본결과 확실히 주말에는 주중보다 확진자 수가 적은 것을 확인할 수 있다.
'데이터 분석 > 코로나19' 카테고리의 다른 글
COVID-19 ( 7 - Data analysis and visualization )) (0) 2021.02.17 COVID-19 ( 5 - 분석 및 검증) (0) 2021.02.08 COVID-19 ( 4 - 데이터 전처리 ) (0) 2021.02.06 COVID-19 ( 3 - 데이터 전처리 ) (0) 2021.02.06 COVID-19 ( 2 - 데이터 크롤링 ) (0) 2021.02.06