[ISSUE COMPANY] 신테카바이오, 슈퍼컴퓨터·AI 기술로 약물후보 2주 만에 찾는다
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
신테카바이오는 지난해 2월 AI 플랫폼 ‘딥매쳐’를 이용해 코로나19 치료제 후보물질 2개를 찾았다. 류코트리엔 수용체를 차단하는 ‘자피르루카스트(zafirlukast)’와 혈소판 응집을 막는 ‘설핀피라존(sulfinpyrazone)’이다. 동물실험에서 두 약물을 병용투여한 결과(STB-R011) 렘데시비르와 유사한 치료 효과를 보였다.
윤선일 신테카바이오 사업 개발부 이사는 “지난해 9월에 전임상을 마쳤고, 올 여름쯤에는 글로벌 임상 1상에 진입할 것으로 보인다”고 말했다. 현재 신테카바이오는 한미사이언스와 함께 임상개발을 진행 중이다.
CPU·GPU 2000개 규모의 슈퍼컴퓨터 인프라
신테카바이오는 코로나19의 유전 정보가 공개된 지 한 달도 되지 않아 약물 STB-R011을 발굴했다. 회사 설명에 따르면 유효물질(hit compound)을 찾아내는 데 걸리는 시간은 고작 2주다. 유효물질을 화학적으로 합성하고 검증하는 과정까지 다 합쳐도 석 달이 채 걸리지 않는다.
이렇게 빠른 예측이 가능한 것은 신테카바이오가 보유하고 있는 슈퍼컴퓨팅 기술과 인프라 덕분이다. 신테카바이오는 2014년 한국전자통신연구원(ETRI)에서 개발한 ‘유전자 검사 전용 슈퍼컴퓨팅’ 기술을 출자받았다. 뒤이어 대전과 청주에 슈퍼컴퓨터 인프라를 구축했다. 윤 이사는 “GPU(그래픽 처리장치)와 CPU(중앙처리장치)를 모두 합치면 2000개 정도의 규모”라고 말했다.
신테카바이오는 올해 하반기 정도에 데이터센터를 증설해 규모를 더 확장시킬 계획이다. 윤 이사는 “우리처럼 범용이 아니라 특정 목적을 위해서만 슈퍼컴퓨터를 사용하는 경우는 기상청을 제외하고는 없다”고 말했다.
3차원 구조 기반의 약물 동력학 예측 AI, 딥매쳐
신테카바이오가 슈퍼컴퓨터 인프라로 가장 주력하고 있는 기술은 딥매쳐와 네오스캔이다. 딥매쳐는 STB-R011의 사례처럼 약물 재창출이나 처음부터 새로운 약물을 발굴하는 데 모두 사용된다. 여기에는 10억 개의 화합물 데이터베이스가 사용된다.
딥매쳐의 핵심은 3차원 구조를 기반으로 약물의 단백질 결합에너지를 예측한다는 점이다. 마르틴 카르플루스 미국 하버드대 교수와 이론화학 연구자들은 1970년대 화학 물질의 성질을 토대로, 화학 반응을 예측할 수 있는 계산식을 제시했다.
윤 이사는 “컴퓨터 기반 기술이 궤도에 오른 2000년대 이후부터는 여러 연구자들과 신약 개발 회사들에서 이 계산식을 활용하기 시작했다”며 “딥매쳐는 수십 년간 능력이 증명된 이론을 기반으로 설계된 AI”라고 말했다.
전통의 이론화학 계산식을 기반으로 하고 있지만, 10억 개 물질에 대한 모든 계산을 할 수는 없다. 타깃 단백질이 정해지면 신테카바이오의 연구진은 기존에 공개된 논문이나 실험 데이터에서 타깃 단백질과 결합력이 높은 물질, 결합할 가능성이 매우 낮은 물질의 데이터를 수집한다. 즉 성공과 실패 데이터 세트를 마련하는 것이다.
이 과정에서 연구개발(R&D) 협력사들과 기관의 미공개 정보들이 중요한 역할을 한다. 이 데이터로 학습한 딥매쳐는 대략적인 ‘경향성’을 가지고 10억 개의 화학물질 중 상온에서 안정적으로 결합할 수 있는 화합물을 선별해낸다. 그리고 다시 수차례에 걸친 최적화 과정을 통해 최종적으로 수십 개의 화합물을 골라낸다.
윤 이사는 “키나아제(269개), GPCR(69개), 프로테아제(21개) 등 주요 타깃 단백질 600여 개에 대해서는 이미 학습을 마친 딥매쳐 모델을 보유하고 있다” 고 말했다.
진입장벽 높은 암 신생항원, 네오스캔 활용해 발굴
반면 네오스캔은 면역항암제에 특화된 AI다. 면역 항암제에는 면역관문억제제, 면역세포치료제, 항암바이러스치료제, 치료용 암백신 등이 있다. 키트루다, 옵디보, 여보이 등 시장에서 판매되는 대다수의 면역항암제는 면역관문억제제다.
면역관문억제제는 한번 ‘발동이 걸리면’ 효능은 좋지만, 발동이 걸리는 환자가 제한적이라는 한계가 있다. 이 때문에 새로운 면역항암제가 개발돼야 할 필요가 커지고 있다.
네오스캔은 암세포에서만 발현되는 신생항원을 찾는 AI다. 세포는 저마다 주조직적합성복합체 (MHC) 분자를 가지고 있다. MHC는 사람마다 서로 다르기 때문에 면역세포가 ‘나’인지 ‘남’인지를 판별하는 데 중요한 역할을 한다. 세포가 면역세포를 만나면 자신의 단백질 일부(항원)를 제시하는 데, 면역세포는 이를 인지해 ‘남’이라고 판단할 경우 공격한다.
암세포의 경우 제시할 수 있는 항원 중 1~2%만이 면역반응을 유도하는 신생항원이다. 윤 이사는 “사람이 찾아내기에는 진입장벽이 높은 분야”라며 “유전체 분석과 AI 기술을 모두 이용해야 신생항원을 효율적으로 발굴할 수 있다”고 말했다.
신테카바이오는 암종마다 수십에서 수백 명의 환자 유전체를 수집하고 있다. 암세포의 DNA와 정상 세포의 DNA를 모두 시퀀싱한 뒤, 이 둘을 비교분석한다. 그러고 난 뒤 암세포에만 존재하는 돌연변이 유전자에서 발현되는 단백질(항원)의 3차원 구조를 시뮬레이션한다. 이를 기반으로 AI가 MHC 분자에 안정적으로 결합할 항원을 예측한다.
이렇게 선별된 항원은 치료용 암백신이나 세포치료제 등 다양한 모달리티에 적용할 수 있다.
윤 이사는 “갈수록 면역항암제 시장에서도 개인맞춤 신생항원 기반의 치료제 개발 비중이 높아지고 있다”며 “신테카바이오는 차세대염기서열분석(NGS)과 AI 기술을 모두 보유함으로써 시장 흐름에 발맞춰가고 있다”고 말했다.
현재 네오스캔을 이용해 발굴한 신생항원 치료제는 ‘STB-B010’ ‘STB-B020’ 등 두 개다. 윤 이사는 “STB-B010이 조금 더 속도가 빠르다”며 “현재 네오스캔의 성능 검증실험을 위한 임상 연구를 진 행 중”이라고 밝혔다.
신테카바이오는 딥매쳐, 네오스캔을 중심으로 한 AI 플랫폼으로 현재 10여 개의 파이프라인을 확보했다. 이 중에는 레고켐바이오사이언스, JW중외 제약과 개발 중인 약물도 있다. 윤 이사는 “AI가 특히 강점을 보일 수 있는 부분은 약물의 발굴 단계이기 때문에, 신규 물질을 늘리는 것이 필요하다”며 “올해까지 지금보다 3배 규모의 파이프라인을 확보하는 게 목표”라고 말했다.
최지원 기자
*이 기사는 <한경바이오인사이트> 매거진 2021년 5월호에 실렸습니다.
윤선일 신테카바이오 사업 개발부 이사는 “지난해 9월에 전임상을 마쳤고, 올 여름쯤에는 글로벌 임상 1상에 진입할 것으로 보인다”고 말했다. 현재 신테카바이오는 한미사이언스와 함께 임상개발을 진행 중이다.
CPU·GPU 2000개 규모의 슈퍼컴퓨터 인프라
신테카바이오는 코로나19의 유전 정보가 공개된 지 한 달도 되지 않아 약물 STB-R011을 발굴했다. 회사 설명에 따르면 유효물질(hit compound)을 찾아내는 데 걸리는 시간은 고작 2주다. 유효물질을 화학적으로 합성하고 검증하는 과정까지 다 합쳐도 석 달이 채 걸리지 않는다.
이렇게 빠른 예측이 가능한 것은 신테카바이오가 보유하고 있는 슈퍼컴퓨팅 기술과 인프라 덕분이다. 신테카바이오는 2014년 한국전자통신연구원(ETRI)에서 개발한 ‘유전자 검사 전용 슈퍼컴퓨팅’ 기술을 출자받았다. 뒤이어 대전과 청주에 슈퍼컴퓨터 인프라를 구축했다. 윤 이사는 “GPU(그래픽 처리장치)와 CPU(중앙처리장치)를 모두 합치면 2000개 정도의 규모”라고 말했다.
신테카바이오는 올해 하반기 정도에 데이터센터를 증설해 규모를 더 확장시킬 계획이다. 윤 이사는 “우리처럼 범용이 아니라 특정 목적을 위해서만 슈퍼컴퓨터를 사용하는 경우는 기상청을 제외하고는 없다”고 말했다.
3차원 구조 기반의 약물 동력학 예측 AI, 딥매쳐
신테카바이오가 슈퍼컴퓨터 인프라로 가장 주력하고 있는 기술은 딥매쳐와 네오스캔이다. 딥매쳐는 STB-R011의 사례처럼 약물 재창출이나 처음부터 새로운 약물을 발굴하는 데 모두 사용된다. 여기에는 10억 개의 화합물 데이터베이스가 사용된다.
딥매쳐의 핵심은 3차원 구조를 기반으로 약물의 단백질 결합에너지를 예측한다는 점이다. 마르틴 카르플루스 미국 하버드대 교수와 이론화학 연구자들은 1970년대 화학 물질의 성질을 토대로, 화학 반응을 예측할 수 있는 계산식을 제시했다.
윤 이사는 “컴퓨터 기반 기술이 궤도에 오른 2000년대 이후부터는 여러 연구자들과 신약 개발 회사들에서 이 계산식을 활용하기 시작했다”며 “딥매쳐는 수십 년간 능력이 증명된 이론을 기반으로 설계된 AI”라고 말했다.
전통의 이론화학 계산식을 기반으로 하고 있지만, 10억 개 물질에 대한 모든 계산을 할 수는 없다. 타깃 단백질이 정해지면 신테카바이오의 연구진은 기존에 공개된 논문이나 실험 데이터에서 타깃 단백질과 결합력이 높은 물질, 결합할 가능성이 매우 낮은 물질의 데이터를 수집한다. 즉 성공과 실패 데이터 세트를 마련하는 것이다.
이 과정에서 연구개발(R&D) 협력사들과 기관의 미공개 정보들이 중요한 역할을 한다. 이 데이터로 학습한 딥매쳐는 대략적인 ‘경향성’을 가지고 10억 개의 화학물질 중 상온에서 안정적으로 결합할 수 있는 화합물을 선별해낸다. 그리고 다시 수차례에 걸친 최적화 과정을 통해 최종적으로 수십 개의 화합물을 골라낸다.
윤 이사는 “키나아제(269개), GPCR(69개), 프로테아제(21개) 등 주요 타깃 단백질 600여 개에 대해서는 이미 학습을 마친 딥매쳐 모델을 보유하고 있다” 고 말했다.
진입장벽 높은 암 신생항원, 네오스캔 활용해 발굴
반면 네오스캔은 면역항암제에 특화된 AI다. 면역 항암제에는 면역관문억제제, 면역세포치료제, 항암바이러스치료제, 치료용 암백신 등이 있다. 키트루다, 옵디보, 여보이 등 시장에서 판매되는 대다수의 면역항암제는 면역관문억제제다.
면역관문억제제는 한번 ‘발동이 걸리면’ 효능은 좋지만, 발동이 걸리는 환자가 제한적이라는 한계가 있다. 이 때문에 새로운 면역항암제가 개발돼야 할 필요가 커지고 있다.
네오스캔은 암세포에서만 발현되는 신생항원을 찾는 AI다. 세포는 저마다 주조직적합성복합체 (MHC) 분자를 가지고 있다. MHC는 사람마다 서로 다르기 때문에 면역세포가 ‘나’인지 ‘남’인지를 판별하는 데 중요한 역할을 한다. 세포가 면역세포를 만나면 자신의 단백질 일부(항원)를 제시하는 데, 면역세포는 이를 인지해 ‘남’이라고 판단할 경우 공격한다.
암세포의 경우 제시할 수 있는 항원 중 1~2%만이 면역반응을 유도하는 신생항원이다. 윤 이사는 “사람이 찾아내기에는 진입장벽이 높은 분야”라며 “유전체 분석과 AI 기술을 모두 이용해야 신생항원을 효율적으로 발굴할 수 있다”고 말했다.
신테카바이오는 암종마다 수십에서 수백 명의 환자 유전체를 수집하고 있다. 암세포의 DNA와 정상 세포의 DNA를 모두 시퀀싱한 뒤, 이 둘을 비교분석한다. 그러고 난 뒤 암세포에만 존재하는 돌연변이 유전자에서 발현되는 단백질(항원)의 3차원 구조를 시뮬레이션한다. 이를 기반으로 AI가 MHC 분자에 안정적으로 결합할 항원을 예측한다.
이렇게 선별된 항원은 치료용 암백신이나 세포치료제 등 다양한 모달리티에 적용할 수 있다.
윤 이사는 “갈수록 면역항암제 시장에서도 개인맞춤 신생항원 기반의 치료제 개발 비중이 높아지고 있다”며 “신테카바이오는 차세대염기서열분석(NGS)과 AI 기술을 모두 보유함으로써 시장 흐름에 발맞춰가고 있다”고 말했다.
현재 네오스캔을 이용해 발굴한 신생항원 치료제는 ‘STB-B010’ ‘STB-B020’ 등 두 개다. 윤 이사는 “STB-B010이 조금 더 속도가 빠르다”며 “현재 네오스캔의 성능 검증실험을 위한 임상 연구를 진 행 중”이라고 밝혔다.
신테카바이오는 딥매쳐, 네오스캔을 중심으로 한 AI 플랫폼으로 현재 10여 개의 파이프라인을 확보했다. 이 중에는 레고켐바이오사이언스, JW중외 제약과 개발 중인 약물도 있다. 윤 이사는 “AI가 특히 강점을 보일 수 있는 부분은 약물의 발굴 단계이기 때문에, 신규 물질을 늘리는 것이 필요하다”며 “올해까지 지금보다 3배 규모의 파이프라인을 확보하는 게 목표”라고 말했다.
최지원 기자
*이 기사는 <한경바이오인사이트> 매거진 2021년 5월호에 실렸습니다.