ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • COVID-19 ( 5 - 분석 및 검증)
    데이터 분석/코로나19 2021. 2. 8. 16:08

    지난 게시글에서 데이터프레임의 "확진일" 컬럼으로 앞으로 분석에 사용하기 위해 만든 새로운 컬럼을 바탕으로 가설 검증을 해보겠다.

     

     

    -> 시각화를 위한 라이브러리를 불러왔다.

     

    1) 과연 코로나 확진자 수는 연휴 기간이 지난 후 급증하는가???

     

    내가 세운 첫 번째 가설이다. 이미 우리나라는 1년이라는 시간동안 코로나와 싸우고 있다. 그 동안 외출을 자제하며, 마스크와 손 소독제를 가지고 다니면서 개인 방역에 신경을 쓰면서 지냈지만 코로나가 끝나지 않고 계속 이어지자 답답한 사람들이 외출을 시도하고있다. 연휴가 길수록 외출하는 사람이 많다. 외출이 많아진다는 것은 곧 사람들간의 접촉이 늘어나게되며 코로나의 위험성을 증가시키게 된다. 기존의 데이터프레임의 '확진일'컬럼을 이용해 가설을 확인해보겠다.

     

     

    -> 기존의 데이터프레임의 "확진일"컬럼을 value_counts() 해본 결과 확진자가 주로 12월에 몰려있음을 알 수 있다.

     

     

    -> '년월'컬럼을 value_counts( ) 해본 결과 역시 12월에 확진자가 가장 많이 몰려있으며, 그 다음으로 1월, 11월( 20년), 8월( 20년)으로 각각 3차 대유행과, 이태원 클럽으로 인해 많은 확진자가 발생했다는 것을 알 수 있다. ( 신천지로 인한 감염은 해당 데이터가 서울 데이터이기 때문에 빠져있다. )

     

     

    -> '년월'컬럼을 막대그래프로 시각화하였으며 3차 대유행으로 연말에 워낙 많은 확진자가 발생한 탓에 20년도 1분기와 2분기 확진자는 비교적 적게 보이기에 숫자를 표시하였다.

     

     

    -> 주차별 확진자 수를 확인하기 위해 groupby 를 통해 '년월', '주' 컬럼을 그룹화시켰다.

     

     

    -> 20년1월 4주차부터 21년 4주차 까지 나왔지만 21년 1월 53주차의 위치가 잘못되었다. 여기서 1월에도 53주차가 존재하는 이유는 기본적으로 월요일부터 주가 시작되는데 21년 1월1일이 금요일이기 때문에 21년 53주차는 20년 53주차에서 이어지는 것으로 21년 53주차에는 '금', '토', '일'의 데이터가 들어가있다.

     

     

    -> GetWeekFirst 함수를 사용하여 20년 53주차와 21년 53주차가 이어질 수 있도록 수정하였다.

     

     

    -> 함수 이후에 다시 한번 그래프를 그려본 결과 이상없이 나타난 것을 확인할 수 있다. 그러면 과연 여기서 긴 연휴 이후에는 코로나 확진자 수가 급증했다고 판단할 수 있는지 확인해보겠다. 우선 3월 신천지 이후 발생한 확진자 추이를 살펴보겠다. 

     

    -> 2020년 공휴일로 지정된 날짜이다.

     

     

    ( 1 )

    -> 21대 국회의원 선거와 석가탄신일, 어린이날은 공휴일이 주중이였기 때문에 코로나 확진자 증가에는 큰 영향이 없어보이지만 5월에 발생한 이태원 클럽발 집단감염으로 인해 19주차부터 확진자 수가 급격하게 증가하였다.

     

     

    ( 2 )

    -> 현충일 같은 경우 공휴일이 주말이였지만 임시공휴일이 지정되지 않았고 이전 5월달 이태원 클럽발 집단감염이 계속 꼬리를 물고 감염 범위를 넓혀가고있었기 때문에 현충일로 인해 감염이 증가했다고 판단할 수 는 없을거 같다.

     

     

    ( 3 )

     

    -> 이태원 클럽 집단 감영이 발생하고 난뒤 확진자 수가 감소되며 안정은 되찾고 있을 때 8월 15일에 이루어진 '8.15 광화문 집회'로 인해 신천지에 이어서 2차 대유행이 시작되었다. 현충일과는 다르게 임시공휴일까지 추가되면서 워낙 많은 인원이 야외에 모였고 집회의 특성상 타인과 거리가 매우 밀접한 상황에 큰 목소리를 내기 때문에 감염이 전파되기 쉬운 환경이였다.

    -> 광화문 집회와 ****교회에서 대규모 집단감염이 발생하였다. 또한 집회와 교회에 참석한 사람들이 다른 사람들에게 코로나를 전파시키는 꼬리를 무는 n차 감염으로 인해 확진자 수는 크게 증가하였으며 그 이후로도 확진자 수가 광복절 집회 이전으로 돌아가지 못했다.

    -> 9월 말 추석 연휴로 인해 확진자 수치는 또 한번 크게 증가하였다. 집회만큼의 수치는 아니였지만, 전 주에 비해서 두 배 이상의 확진자가 발생하였고, 이제는 '신천지', '광화문 집회' 과 다르게 가족과 지인의 의한 감염이 커지고 있다.

     

     

    -> 5월 '이태원 클럽 집단 감염'과 8월,9월 '8-15 광복적 집회' 및 '교회'등 으로 인해 이미 방역의 한계를 느끼고 있었지만 10월 31일 '할로윈' 축제가 이동범위가 넓은 젊은 층을 대상으로 일어나면서 3차 대유행이 시작되었다. 

    또한 추워진 날씨와 신천지와 교회등 집단을 중심으로 발생했던 1,2차 때와는 달리 학교, 병원, 음식점등 일상생활에서 동시다발적으로 집단감염이 전국에서 동시다발적으로 발생하기 시작하였기 때문에 기존 방역체계로는 감염경로 파악조차 불가능하게 확진자 수가 증가하였다.

    -> 12월에는 일일 감염자만 1000명이 넘으며 절정에 올라섰다.

    -> 현재는 사회적 거리두기를 강화해 5인이상 집합 금지와 9시 이후 영업금지라는 강수를 세우면서 방역에 힘쓰고 있지만 일일 400~500대를 넘나드는 추세이다.

     

     

     

    결론 )

    - 확실히 연휴가 지난 이후에는 확진자 수가 증가하는 것은 어느정도 데이터로 확인할 수 가 있다. 

Designed by Tistory.