데이터 너드에게 새로운 분석에 대한 도전 거리를 끊임없이 주는 영역이 있다. 스포츠, 전쟁, 그리고 감염병이다. 이 영역은 모두 인간의 의도, 인간이 의도하지 않은 영향, 그리고 무작위적 현상이 폭넓게 뒤섞인다는 점에서 엄청난 호기심을 자극한다. 최근에 코로나바이러스도 여러 분석 작업에 대한 상상력을 자극하는 점이 있었다. 그러나 지금 상황의 위중함을 생각할 때 나의 “재미”를 위해 분석을 한다는 것이 어디가 마음에 걸리기도 했다. 그리고 온갖 쓰레기 같은 정보가 범람하는 이런 시기에 비전문가는 조용히 입을 다무는 것이 타당하다는 생각도 들었기 때문이다.
그러나 한편으로 지금처럼 온갖 보도와 정보가 난무하는 상황일수록 간명하게 상황을 요약하고 약간의 지혜를 얻는 분석 작업도 의의가 있지 않을까 생각해서 몇 가지 작업을 혼자 해보았다. 그중 하나는 웹에 공표된 정부 발표 감염 관련 자료를 자동으로 끌어와서 심플한 정보로 정제하는 것이다. 아래 그림은 그 작업 결과 가운데 하나이다.
그림에서 동그라미는 지역을 의미하고, 각 지역과 연결된 네모는 감염이 촉발된 특정 지점(병원, 교회 등)을 의미한다. 동그라미와 네모의 크기는 3월 10일 자정 공식 발표된 확진자 수에 따라 보정한 것이다. 지역 감염자 수는 지역 내(그림에서 연결된) 특정 감염 경로에 따른 확진자 수와 지역감염자 수를 더한 것이다. 하지만 대구와 신천지교회가 차지하는 비중이 압도적으로 크기 때문에 원래 값에 상용로그값을 사용했다. 실제 규모 차이는 좌상단의 비교 그림을 통해 짐작할 수 있다. 중간에 점선은 “관련성이 있음”으로 조사되었기에 연결하였다.
간단한 그림이지만 지역별로 어떤 대응이 필요할지 약간의 시사를 얻을 수 있다.
1) 대구와 신천지의 확진자는 현재까지 상당히 겹쳤음을 알 수 있다. 앞으로 문제는 2차, 3차의 지역 감염에 따라 대구 자체의 감염 규모가 점점 커지지 않도록 총력을 다하는 것이다. 당분간 해당 지역의 “사회적 거리 두기”가 절실할 것으로 보인다.
2) 경북은 일정 규모 이상의 감염 촉발 지역이 다수를 이루고 있음을 할 수 있다. 이는 다중 이용시설에 대한 지자체의 모니터링과 감독 역량을 점검할 필요성을 일깨운다.
3) 그림에서 볼 수 있듯, 거대한 매개집단이 있는 이상 지리적 거리가 무색한 상황이다. 이런 상황에서 개별 지방정부 차원의 대응은 한계가 있을 것이다. 중앙정부는 거대 매개원에 대한 협조 요청과 더불어 보다 적극적인 액션을 취할 필요성이 있지 않을까 생각한다.
자정마다 업데이트된 정보를 끌어와서 그림을 그리도록 만들어보았는데, 그래도 우울한 때 약간의 쉼이 되어준 것 같다. 어서 빨리 이 시기가 지나길 바라본다.


댓글 남기기