[코로나 대해부] 바이러스 뉴노멀, 바이오 인포매틱스 시대 열린다

코로나바이러스(SARS-CoV-2)는 지금껏 우리가 겪어온 바이러스와는 전혀 다른 ‘별난 놈’이다. 코로나바이러스가 꿈틀거리기 시작하던 3월부터 많은 의학계 전문가들이 신종 코로나바이러스 감염증(코로나19)에 대해 여러 가지 예측을 했지만 번번이 빗나갔다. 무증상 감염, 공기 감염, 빠른 변이 등 가능성이 낮다고 점쳐지던 것들이 사실로 드러났다. 우리의 예상을 한참 웃돌 만큼 생존력이 강한 바이러스다. 전문가들은 자연종식보다는 백신이 나와야 코로나19 대유행이 끝날 수 있을 것이라고 말한다.

다행히도 코로나19의 백신 개발은 순항하고 있다. 다국적 제약사인 화이자, 모더나, 아스트라제네카 등이 현재 임상 3상을 진행하고 있다. 특히 화이자는 10월까지 미국 식품의약국(FDA)의 승인을 받겠다고 밝혔다. 하지만 백신이 성공적으로 개발된다고 우리는 과연 안심해도 되는 걸까.◆코로나19 끝나도 박쥐 유래 바이러스 또 찾아올 것

안타깝게도 박쥐에 사는 바이러스만 150여 종에 이른다. 미국 NGO단체인 에코헬스 얼라이언스는 포유류를 감염시키는 바이러스 586종을 분석한 결과를 2017년 국제학술지 ‘네이처’에 발표했다. 이 연구를 통해 인간을 감염시키는 바이러스는 263개였고, 이중 약 69%에 해당하는 156종이 박쥐에서 유래됐다는 것이 밝혀졌다.

2019년 국제학술지 ‘바이러스’에 발표한 중국 우한바이러스연구소의 논문에 따르면 박쥐 안에 사는 바이러스들은 주기적으로 유전자재조합을 일으키기 때문에 이전과 전혀 다른 새로운 코로나바이러스를 만들어낼 수 있다. 린파 왕 미국 듀크대 교수는 한 인터뷰에서 “향후 10년 안에 박쥐에서 퍼진 새로운 살인 바이러스가 출현할 것”이라고 코로나19 이후의 시대를 예측했다. 이런 이유로 세계 여러 기업들과 기관들이 포스트 코로나바이러스를 준비하고 있다. 핵심은 바이오인포매틱스를 활용한 예측 기법이다. 2010년대부터 스위스의 로슈, 미국의 일루미나 등 거대 바이오기업들이 유전정보를 빠르게 분석할 수 있는 차세대 염기서열분석(NGS) 기법을 개발하면서 바이오인포매틱스의 시대가 열렸다. 이번 코로나19 사태에서도 바이러스의 항원의 유전자 정보 등을 빠르게 파악하는 데 NGS가 제 역할을 톡톡히 해냈다. 국내에서는 마크로젠이 유일하게 세계 NGS 상위 10대 기업에 이름을 올렸다.

◆유전자 분석·인공지능 융합기술이 바이오 경쟁력 가를 것

전염병 확산을 예방하기 위해 바이오인포매틱스는 크게 두 가지 방향으로 활용된다. 한 축은 아직 발견되지 않았지만 인류에게 위협을 가할 수 있는 바이러스를 사전에 찾는 것이다. 미국 국제개발처(USAID)는 미국 데이비스 캘리포니아대(UC데이비스), 영국 스미스소니언협회, 에코헬스 얼라이언스 등과 함께 감염병 방지를 위한 연구 프로젝트 ‘프레딕트(PREDICT)’를 출범했다.
프레딕트는 31개국에서 새로운 신종 바이러스 949종을 찾았고, 야생에 살고 있는 바이러스들을 데이터베이스화 하는 작업을 수행했다. 프레딕트 프로젝트에 참여하는 수파폰 와차라플루사디 세계보건기구(WHO) 건강과학센터 박사는 “프레딕트의 목표는 인간에게 위협이 될 수 있는 바이러스의 99%를 미리 발견하고 식별하는 것”이라며 “데이터베이스를 구축하면 향후 감염병이 돌더라도 정체를 빨리 파악할 수 있어 큰 도움이 된다”고 말했다.

나머지 한 축은 과거에 발생했던 혹은 현재 퍼져나가는 전염병 정보를 수집해 위험성을 판단하는 연구다. 70여 년간 유전자 데이터가 쌓인 인플루엔자의 경우 매년 WHO가 북반구를 기준으로 올해 유행할 인플루엔자 바이러스를 발표한다. 전년도 겨울에 유행했던 바이러스의 정보와 바이러스의 병독성 등을 분석해 A형과 B형 각각 한 개의 바이러스를 지목한다. 세계의 제약사들은 이 정보를 토대로 백신을 개발해 감염병 유행을 사전에 대비한다. WHO는 전 세계의 전염병 위험요소를 미리 파악해 위급상황을 대처할 수 있는 협력 프로젝트인 ‘WHO 건강 위급 프로그램(WHE)’을 진행하고 있다. WHE에서는 수십만 건의 정보들을 수집해 위험도 분석을 통해 위협이 될 수 있는 10개 내외의 사건을 선별한다. 이렇게 가공된 데이터는 여러 나라들에게 전달된다.


국내에서는 한국과학기술정보연구원(KISTI) 데이터기반문제해결연구단이 포스트 코로나 바이러스의 확산 방지를 위해 연구 중이다. 연구팀은 세계에서 발생하고 있는 감염병 200여 개를 분석해 우리나라와의 상관도를 계산하는 시스템을 개발했다. 이 시스템을 이용하면 우리나라에 감염병이 퍼지기 6개월 전에 미리 예측할 수 있다.

데이터기반문제해결연구단은 전 세계의 감염병 발생정보를 수집해 공유하는 프로그램인 ‘프로메드(ProMED)’의 정보를 이용해 감염병이 퍼지기에 비슷한 환경을 가진 나라들을 묶어 분류했다. 그중 중국, 대만, 태국, 말레이시아, 필리핀, 터키, 이탈리아 등 우리나라에 큰 영향을 미치는 나라를 선별했다. 이 나라들에서 위험요소에 점수를 매겨 특정한 임계점이 넘어가면 우리나라에서 발생 가능성이 높은 감염병이라고 판단한다. 현재 정확도는 76% 정도지만 좀 더 정확하고 많은 데이터 수집을 통해 정확도를 높여가고 있다. 연구를 주도하는 안인성 KISTI 책임연구원은 “바이오인포매틱스 기술은 신종 바이러스와의 정보전에서 승리하기 위한 최선의 도구”라며 “향후 인공지능 기법을 활용한 분석 도구들이 국내 기술로 개발된다면 바이오 업계의 세계적인 경쟁력을 가질 수 있을 것”이라고 말했다.

최지원 기자 jwchoi@hankyung.com