2억개 모든 생물 단백질 구조…이세돌 꺾은 '알파고'가 밝혔다
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
디지털 생물학 새 시대
단백질 구조, 질병 치료 핵심
구글 딥마인드 AI, 1년만에 완수
인간이 찾아낸 것은 19만개
내성 없는 항생제·플라스틱 분해
美·英선 다양한 연구에 활용
단백질 변화 파악엔 한계 보여
단백질 구조, 질병 치료 핵심
구글 딥마인드 AI, 1년만에 완수
인간이 찾아낸 것은 19만개
내성 없는 항생제·플라스틱 분해
美·英선 다양한 연구에 활용
단백질 변화 파악엔 한계 보여
‘디지털 생물학의 새로운 시대가 열렸다.’
지난달 29일 과학저널 ‘사이언스’의 헤드라인이다. 알파벳(구글 모회사)의 영국 자회사인 딥마인드가 알파폴드로 2억1400만 개 단백질 구조를 공개하자 사이언스는 “인류가 파악한 거의 모든 단백질 구조가 베일을 벗었다”고 했다.
단백질은 질병 원인을 파악하고 신약 등을 개발하는 데 쓰이는 필수 요소다. 단백질 설계도는 유전체다. 2억 개 넘는 설계도가 확인됐지만 실제 단백질 구조를 알아낸 것은 19만 개 정도다. 인간 유전체가 해독됐지만 질병 극복 시대를 열지 못했던 이유다. 딥마인드는 인공지능(AI)으로 오랜 난제를 1년 만에 해결했다. 6년 전 알파고로 이세돌을 꺾은 딥마인드가 생물학의 역사를 바꾸고 있다는 평가다.
2003년 인간의 DNA 서열을 모두 파악한 게놈프로젝트가 끝난 뒤 과학자들은 이를 활용해 단백질 구조를 파악하는 데 집중했다. 설계도를 손에 넣었지만 실제 구조물을 만드는 것은 간단치 않았다. 1차원 아미노산 설계도가 다양한 방향으로 뭉치고 꼬이며 3차원 단백질로 바뀌는 ‘단백질 접힘’ 현상 탓에 결과물을 파악하는 게 어려웠다.
과학자들은 50여 년간 엑스레이나 현미경으로 단백질 결정 등을 파악해 전체 모양을 추정해왔다. 단백질 하나의 모양을 파악하는 데 수개월에서 수년이 걸렸다.
미국 콜로라도 볼더대 연구진은 알파폴드로 대장균 구조를 파악해 내성 문제를 해결한 항생제 개발에 나섰다. 사라져가는 꿀벌의 면역력을 높이는 연구도 하고 있다. 영국 포츠머스대 연구진은 효소 단백질 구조를 파악해 플라스틱을 100% 분해하는 기술을 개발하고 있다. 한센병 등 감염 질환을 해결하는 데에도 알파폴드가 활용되고 있다. 에릭 토폴 미국 스크립스연구소 창립자는 “거의 모든 단백질의 세계를 확인할 수 있게 되면서 매일 더 많은 생물학적 미스터리가 풀릴 것”이라고 했다.
알파폴드는 2020년 세계 단백질구조예측능력 평가대회(CASP)에서 이름을 알렸다. 당시 92.4점으로 1위를 차지했다. 알파폴드가 설계도를 보고 예측한 단백질 구조가 실험실에서 엑스레이 등으로 파악한 구조와 거의 같다는 의미다. 후발 주자는 70점대였다.
딥마인드는 지난해 7월 알파폴드 원리 등을 국제학술지에 공개했다. 단백질 36만5000여 개를 검색할 수 있는 서비스도 내놨다. 인체 구성 단백질 서열 2만5000개 중 98% 이상이 포함됐다. 지난해 말엔 이 숫자가 100만 개까지 늘었다. 1년 만에 190개국 50만 명 넘는 연구진이 단백질 구조물을 200만 건 넘게 확인했다.
AI로 단백질 구조를 예측하는 기술은 미래형 혁신 기술로 꼽힌다. 국내 기업도 늘었다. 카카오브레인은 국내 바이오기업 갤럭스와 항체 신약 설계 플랫폼을 개발하고 있다. 굿인텔리전스, 파노로스바이오사이언스, 디어젠, 팜캐드, 인세리브로 등도 이 기술로 신약을 개발하고 있다.
이지현 기자 bluesky@hankyung.com
지난달 29일 과학저널 ‘사이언스’의 헤드라인이다. 알파벳(구글 모회사)의 영국 자회사인 딥마인드가 알파폴드로 2억1400만 개 단백질 구조를 공개하자 사이언스는 “인류가 파악한 거의 모든 단백질 구조가 베일을 벗었다”고 했다.
단백질은 질병 원인을 파악하고 신약 등을 개발하는 데 쓰이는 필수 요소다. 단백질 설계도는 유전체다. 2억 개 넘는 설계도가 확인됐지만 실제 단백질 구조를 알아낸 것은 19만 개 정도다. 인간 유전체가 해독됐지만 질병 극복 시대를 열지 못했던 이유다. 딥마인드는 인공지능(AI)으로 오랜 난제를 1년 만에 해결했다. 6년 전 알파고로 이세돌을 꺾은 딥마인드가 생물학의 역사를 바꾸고 있다는 평가다.
2억1400만 개 단백질 구조 모두 예측
단백질은 각종 기관과 호르몬, 효소 등을 이루는 인체 핵심 구성 요소다. 정확한 기능을 파악하면 암 등을 치료하고 감염병을 예방할 수 있다. 노화 단백질을 활용하면 이론적으로 노화를 늦추거나 막을 수도 있다. 단백질은 어떻게 생겼는지(구조)에 따라 역할이 달라진다. 단백질이라는 골격을 만들기 위해 생명체는 DNA를 설계도로 쓴다. DNA가 아미노산 서열로 바뀌고, 다시 단백질을 만들면서 생명 활동을 한다.2003년 인간의 DNA 서열을 모두 파악한 게놈프로젝트가 끝난 뒤 과학자들은 이를 활용해 단백질 구조를 파악하는 데 집중했다. 설계도를 손에 넣었지만 실제 구조물을 만드는 것은 간단치 않았다. 1차원 아미노산 설계도가 다양한 방향으로 뭉치고 꼬이며 3차원 단백질로 바뀌는 ‘단백질 접힘’ 현상 탓에 결과물을 파악하는 게 어려웠다.
과학자들은 50여 년간 엑스레이나 현미경으로 단백질 결정 등을 파악해 전체 모양을 추정해왔다. 단백질 하나의 모양을 파악하는 데 수개월에서 수년이 걸렸다.
2020년 말 CASP서 가능성 확인
알파폴드는 아미노산 서열을 넣으면 몇 초 만에 단백질 모양을 보여준다. 공개된 설계도와 단백질 구조를 딥러닝으로 학습한 결과다. 2억1400만 개 단백질 구조에는 사람뿐 아니라 동물 식물 세균 곰팡이 등을 구성하는 모든 단백질이 포함됐다.미국 콜로라도 볼더대 연구진은 알파폴드로 대장균 구조를 파악해 내성 문제를 해결한 항생제 개발에 나섰다. 사라져가는 꿀벌의 면역력을 높이는 연구도 하고 있다. 영국 포츠머스대 연구진은 효소 단백질 구조를 파악해 플라스틱을 100% 분해하는 기술을 개발하고 있다. 한센병 등 감염 질환을 해결하는 데에도 알파폴드가 활용되고 있다. 에릭 토폴 미국 스크립스연구소 창립자는 “거의 모든 단백질의 세계를 확인할 수 있게 되면서 매일 더 많은 생물학적 미스터리가 풀릴 것”이라고 했다.
알파폴드는 2020년 세계 단백질구조예측능력 평가대회(CASP)에서 이름을 알렸다. 당시 92.4점으로 1위를 차지했다. 알파폴드가 설계도를 보고 예측한 단백질 구조가 실험실에서 엑스레이 등으로 파악한 구조와 거의 같다는 의미다. 후발 주자는 70점대였다.
딥마인드는 지난해 7월 알파폴드 원리 등을 국제학술지에 공개했다. 단백질 36만5000여 개를 검색할 수 있는 서비스도 내놨다. 인체 구성 단백질 서열 2만5000개 중 98% 이상이 포함됐다. 지난해 말엔 이 숫자가 100만 개까지 늘었다. 1년 만에 190개국 50만 명 넘는 연구진이 단백질 구조물을 200만 건 넘게 확인했다.
화합물 등 구조 파악엔 한계
‘게임체인저’로 불리는 알파폴드에도 한계는 있다. 단백질 구조 하나만 파악하는 데 특화된 탓에 여러 단백질이 뭉쳐지면서 생기는 변화 등을 예측하는 데엔 서툴다. 약물이나 소분자(리간드 등) 등을 단백질에 인위적으로 붙인 신약 개발용 구조물이 어떤 모습일지도 정확히 파악하지는 못한다. 딥마인드는 지난해 11월 알파폴드로 신약을 개발하는 아이소모픽랩스를 창업했지만 아직 결과물을 내놓지 못했다.AI로 단백질 구조를 예측하는 기술은 미래형 혁신 기술로 꼽힌다. 국내 기업도 늘었다. 카카오브레인은 국내 바이오기업 갤럭스와 항체 신약 설계 플랫폼을 개발하고 있다. 굿인텔리전스, 파노로스바이오사이언스, 디어젠, 팜캐드, 인세리브로 등도 이 기술로 신약을 개발하고 있다.
이지현 기자 bluesky@hankyung.com