문득 그런 생각이 들었습니다. 빅데이터, 머신러닝, 인공지능 시대에 ‘우한 바이러스(코로나19 바이러스, COVID-19)’를 좀 더 일찍 알 수는 없었을까? 구글 검색을 해보니 아니나 다를까 그런 회사가 있네요. 우주에서 보면 푸른 점 하나로 작아보이는 지구. 서로 연결되어 전염병 확산 속도도 빨라지는 세상을 푸른 점으로 보고 남보다 먼저 전염병을 눈치채고 알리고 싶었던 창업자의 뜻을 담아 블루닷이라는 회사를 만들었습니다.
정부 관계자가 제 때 알려주지 않는다면 그 나라 뉴스와 의료 정보, 동식물 전염병 정보 등을 뒤져 발병이 의심되는 경우를 찾아내고 그 지역 사람들이 어느 도시로 이동하는지 항공권 발권 정보를 연결해 감염이 확산될 도시를 파악합니다. 인공지능 알고리즘과 외국어를 이해하는 자연어 처리, 머신러닝 등을 적용해 “말하지 않아도 알아요”라고 얘기하는 것 같네요.
대기업이나 대규모 공공기관이 아닌 디지털 강소기업이라 할 수 있는 블루닷의 정확한 예측. 데이터와 사람의 전문역량, 인공지능의 발빠른 패턴 인식 등으로 무장한 디지털 강소기업. 앞으로의 성공이 기대됩니다.
블루닷(BlueDot) 알고리즘은 뉴스 보도와 항공권 발권 데이터를 분석해 중국의 우한 폐렴과 같은 질병의 확산을 예측합니다.
정부 기관보다 빠른 민간 AI 플랫폼
지난 1월 9일 세계보건기구(WHO)는 중국에 독감과 유사한 전염병이 확산되고 있다고 발표했습니다. 우한 지역에 폐렴과 유사한 증상을 보고 받았고 화난수산시장에서 거래되는 동물에 노출된 상인들로부터 시작되었을 가능성을 제기했습니다.
(최근 영국 의학전문지 랜시트에 실린 중국 의료진의 논문에 따르면 12월 1일 최초 감염자뿐 아니라 초기 감염자의 상당수가 화난수산시장과는 전혀 관련이 없어 발병 근원지는 다른 여러 곳일 수 있다고 주장합니다. 또한 잠복기 등을 고려할 때 최초 감염은 지난 해 11월로 추산하고 있습니다.)
이보다 사흘 앞선 1월 6일 미국 질병통제예방센터(CDC)가 이미 우한 폐렴에 대해 발표했습니다. 그런데 캐나다의 보건 감시 플랫폼이 WHO나 CDC 같은 기관보다 한참 전인 12월 31일에 전염병 발병 사실을 고객사에 통지했습니다.
전염병 대응에는 속도가 생명
블루닷(BlueDot)은 AI 기반의 알고리즘이며 외국어 뉴스 보도와 동식물 질병 네트워크, 보건기관 공식 발표자료 등을 분석해 고객에게 우한 같은 위험 지역을 피하도록 조기 경고를 줍니다.
전염병이 발생하면 속도가 생명인데 입을 다물고 쉬쉬하는 중국 정부 관계자들은 그 동안 질병이나 대기오염, 자연재해 등에 관한 정보를 제대로 공유해 온 적이 거의 없습니다. 문제는 WHO나 CDC 등의 공공보건 관계자들 역시 바로 이 중국 정부 관계자에 의존해 자체적인 질병 감시 활동을 전개합니다. 그러니 어쩌면 인공지능(AI)이 더 빨리 상황을 파악할 수 있을지 모릅니다.
“정보를 제 때 제공하는 데 있어 정부는 그다지 믿을만한 소식통이 아닐 수 있다”고 블루닷의 창업자 캠란 칸(Kamran Khan) 회장은 전합니다. “가능성 있는 전염병에 관한 뉴스나 작은 속삭임, 포럼, 블로그 등을 통해 몇몇 종류의 특이한 사건들이 진행되고 있음을 알아챕니다.”
칸 회장은 알고리즘에 소셜 미디어 포스팅 내용은 활용하지 않는다고 밝힙니다. 데이터가 너무 뒤죽박죽이기 때문이죠. 대신에 자신만의 특기가 있습니다. 바로 글로벌 항공권 발권 데이터죠. 발권 내역을 통해 감염자가 언제 어디로 갈 지를 예측하는 데 도움을 얻습니다. 최초 발병 이후 우한에서 방콕, 서울, 타이페이, 도쿄 등지로 바이러스가 이동할 것으로 정확히 예측했습니다.
사후 대응보다는 사전 예측을 꿈꾸다
지난 2003년 캐나다 토론토에서 사스(SARS)가 유행할 당시 병원 전염병 전문가로 일하던 칸 회장은 질병을 추적하는 더 나은 대안을 꿈꿨습니다. 중국에서 출발한 사스 바이러스가 홍콩을 거쳐 토론토로 건너와 44명의 사망자를 냈습니다. “지금도 꼭 그 때를 보는 것 같다”고 칸 회장은 코로나바이러스 전염병에 대해 얘기합니다. “지난 2003년에 사스 바이러스가 토론토를 덮치고 병원을 마비시키는 모습을 지켜봤죠. 정신적으로나 육체적으로 상당히 피로했고 다시는 이러지 말자고 생각했습니다.”
여러 예측 프로그램을 테스트한 후 칸 회장은 2014년 블루닷을 출범 시키고 940만 달러의 벤처 투자를 받습니다. 이제는 의사와 프로그래머 등 40명의 직원이 자연어 처리와 머신러닝 기법을 적용해 65개국어로 된 뉴스 보도와 항공권 데이터, 동물 질병 발병 신고 등의 자료를 분석하는 질병 감시 분석 프로그램을 만듭니다.
“자연어 처리와 머신러닝을 적용해 훈련시킨 결과 이 분석 엔진은 몽골 지역에 탄저병이 발병한 것인지 아니면 헤비메탈 밴드 앤스랙스(Anthrax, 탄저병)의 재결합 소식인지 구분할 줄 알게 되었다”고 칸 회장은 밝힙니다.
말하지 않아도 알아요
자동화 된 데이터 선별이 완료되면 사람이 분석을 시작합니다. (사람과 기계가 협력하는 멋진 사례죠. 여러 나라의 뉴스와 의학 데이터를 분석해 트렌드를 잡아내는 인공지능, 그 결론이 타당한지 검토해 최종 보고서를 작성하는 사람. 서로의 강점을 살리는 협업 관계가 미래입니다.) 역학자들이 인공지능 알고리즘이 내린 결론이 과학적 관점에서 타당한지 확인한 후 보고서를 정부, 기업체, 공공보건 고객에게 발송합니다.
이어서 블루닷의 보고서는 감염 환자가 도착할 가능성이 있는 미국, 캐나다 등 10여 개국 공공 보건 관계자와 항공사, 일선의 병의원에 전달합니다. 블루닷은 일반 대중에게 데이터를 판매하지는 않고 있지만 이 부분에 대해 작업 중이라고 칸 회장은 밝힙니다.
공공 보건 관계자를 피해갈 방안을 물색한 첫 회사는 아니지만 블루닷은 구글 독감 트렌드보다 더 나은 성과를 올렸으면 하고 희망합니다. 구글은 2013년 독감 발병 당시 140퍼센트라는 큰 차이로 사태의 심각성을 과소평가하면서 안락사했죠. 블루닷은 영국 의료전문지 랜시트(The Lancet)에 발표한 논문을 통해 플로리다 남부 지역에 지카 바이러스 확산 위치를 정확히 예측한 바 있습니다.
실제로는 발표 내용보다 큰 규모?
이번에도 블루닷의 예측이 성공할 지는 두고 봐야겠죠. 하지만 그 동안 몇몇 공공 보건 전문가는 2002년에는 사스 전염병을 덮기에 급급했던 중국 관계자들이 이번에는 더 빨리 대응했다고 전합니다.
“공공 보건 관계자들이 밝힌 내용보다 이번 전염병은 훨씬 큰 규모일 수 있다”고 네브라스카대학교 의료센터의 제임즈 롤러(James Lawler) 전염병 전문가는 밝힙니다. 롤러는 2017년과 2018년에 검역을 통해 격리시킨 에볼라 환자를 치료한 바 있습니다. “일주일에 중국에서 얼마나 많은 관광객이 나오는지 대충 계산해 봐도 그 중 일정 비율이 감염자라고 보면 엄청난 숫자죠.”
지난 금요일 뉴욕타임즈는 중국 내 격리된 인구가 8개 도시 3,500만 명에 이른다고 보도했고 월스트리트저널은 발병 근원지로 추정되는 우한의 병의원이 마스크나 소독약 등 의료용품 소진을 이유로 환자를 돌려보내고 있다고 보도했습니다.
롤로를 비롯한 여러 전문가는 해외 여행에 나선 중국 관광객들이 감염 증상을 보이면서 코로나바이러스 전염병이 계속 확산될 전망이라고 전합니다. 얼마나 많은 사람이 증상을 보일지, 전염병이 수그러들 때까지 얼마나 많은 환자가 사망할지 여전히 알 수 없다고 밝힙니다.
질병의 확산을 막으려면 공공 보건 관계자가 진실을 밝히고 빨리 발표해야 합니다. 그런 날이 오기 전까지는 AI 기반의 역학자로 대신하는 일이 가치 있어 보입니다.
- 원문 출처: 와이어드 매거진, 2020년 1월 25일, “An AI Epdemiologist Sent the First Warnings of the Wuhan Virus“