베르티스는 'SAN(Spectrum is All You Need)' 프로젝트를 추진 중이다. SAN은 혈액 검체의 질량분석만으로 질병 여부를 판별할 수 있는 모델을 개발하기 위한 과제다. 멕시코 칸쿤에서 개최된 세계단백체학회에서 난소암과 췌장암에 대해 진단 모델의 정확도를 평가한 첫 번째 연구 결과를 선보였다.
회사가 개발한 심화학습(딥러닝) 모델은 단백체 질량분석 스펙트럼만 가지고 95% 이상의 정확도를 보이며, 난소암과 췌장암 유무를 판별했다는 설명이다. 이번 연구에서 베르티스 연구진은 질량분석을 통해 난소암군 혈액 검체 156개(건강한 사람 50%, 난소암 환자 50%), 췌장암군 혈액 검체 116개(건강한 사람 50%, 난소암 환자 50%)의 단백체 스펙트럼을 확보했다. 이 중 80%의 스펙트럼으로 딥러닝 모델을 학습시키고, 10%로 학습 내용을 검증했다. 나머지 10%를 가지고 질환 유무를 판별하는 검사를 진행했다.
회사 측은 "딥러닝 모델과 단백체 스펙트럼만으로 질병을 진단하는 고무적인 성과를 확인했다"며 "SAN 프로젝트를 통해 주요 질환을 정확하고 신속하게 판별하는 진단 솔루션을 선보이기 위해 연구개발을 가속화할 계획"이라고 했다.
이번 발표는 16년 간 구글에서 소프트웨어 엔지니어로 일하고, 올해 7월 베르티스의 미국법인인 베르티스바이오사이언스에 합류한 에릭 김 수석 머신러닝 엔지니어(사진)가 주도했다.
김상태 베르티스바이오사이언스 최고기술책임자(CTO) "인체의 단백체는 질병 발현의 실제 신호이기 때문에 매우 중요하다"며 "그러나 현재 이 단백체 정보 중 절반 이상이 해석조차 불가능해 버려지고 있는 상황으로, SAN은 단백체 데이터의 해석과 활용을 극대화할 수 있는 길을 열었다"고 말했다.
한민수 기자 hms@hankyung.com