[Cover Story - part 1. HISTORY] 유전자 편집을 위한 도구 ‘유전자가위’, 어떻게 발전해왔나
DNA는 생물의 세포가 유전 정보를 암호화해 저장하는 고분자 물질이다. DNA는 4종류의 염기(base)인 아데닌(A), 티민(T), 구아닌(G), 시토신(C)의 무작위 서열로 유전 정보를 저장한다. 이때 A는 T와, G는 C와 각각 짝을 이뤄 수소 결합한다.

상호보완적인 결합으로 구성된 염기쌍 (base pair)은 흔히 ‘꼬인 사다리’에 비유되는 이중나선 형태로 이어진다. 만약 사다리의 한 축이 AGCCT의 순서로 뻗어나간다면 다른 축의 같은 구간에는 이와 상보적으로 결합하는 TCGGA가 위치하는 것이다.

하나의 세포에 담긴 모든 DNA, 즉 염기서열의 총합을 유전체(genome)라고 한다. 인간 유전체에 담긴 염기쌍의 수는 약 30억 개에 달한다. 유전자 편집(Gene Editing)은 유전체에서 특정한 DNA를 삽입(insertion), 삭제 (deletion) 혹은 치환(substitution)하는 등의 유전자 변환을 의미한다.

인간의 유전체를 30억 개 문자(염기쌍)의 순서가 기록된 1권의 책으로 간주한다면 유전자 편집은 그 중 1쌍의 특정한 문자를 찾아서 지우거나 추가하거나 바꾸는 행위다.

유전자가위는 유전자 편집의 한 방법으로 유전체 내의 특정 DNA를 인식해서 절단하는 기술을 일컫는다. 염기서열을 절단했을 때 나타나는 DNA 복구(DNA repair) 현상을 이용해 유전자 편집을 유도한다.

제한효소의 발견에서 인공 유전자가위 개발까지
1960년대 초 자연계에 존재하는 제한효소(restriction enzyme)의 존재가 알려지며 유전자 편집에 대한 가능성이 처음 열렸다.

하지만 제한효소가 인식하는 염기서열은 6~8개 수준으로 짧다. 30억 쌍에 달하는 인간의 전체 염기서열 속에서는 특이성을 갖추기 어렵다.

4개 문자가 무작위로 반복되는 경우의 수는 6자리일 경우 4096가지다. 염기서열 6개를 인식하는 제한효소라면 확률 상 4096개의 염기서열마다 중복된 서열이 발생한다.

사람의 DNA는 30억 쌍에 달하니 염기서열 6개만을 표적한다면 70만 개 이상의 의도하지 않은 유전자가 절단될 가능성이 생기는 것이다. 염기서열 8개를 표적해서 특정해도 확률적으로 4만 번 넘게 중복될 수 있다.

연구자들은 이러한 제한효소의 한계를 뛰어 넘기 위해 인공적인 방식의 유전자가위를 개발했다. 자연계의 제한효소 중 하나인 ‘FokⅠ’을 활용해 만든 1세대 유전자가위가 징크핑거 핵산분해효 소(ZFN·Zinc Finger Nuclease)다.

징크핑거는 아프리카 발톱개구리의 유전자 연구 과정에서 발견된 손가락 모양의 단백질 구조에서 유래했다. 특정 DNA 염기서열을 인식할 수 있는 징크핑거 단백질 3~5개를 연결하고 그 중앙에 자르는 역할을 하는 FokⅠ과 결합했다. 징크핑거는 9~15개의 염기서열을 인식하도록 제작할 수 있다.

2009년에는 식물성 병원체 ‘잔토모나스(Xanthomonas)’에서 찾은 유전자 인지 도메인인 ‘TAL’을 FokⅠ과 결합한 2세대 유전자가위 탈렌(TALEN)이 개발됐다. 탈렌은 약 15개의 염기서열을 인식한다.

하지만 징크핑거와 탈렌은 유전자가위로서 기능하기엔 설계 및 제작 과정이 복잡하고 비용이 많이 든다는 단점이 있었다. 징크핑거는 목표한 염기서열과 유사하지만 다른 염기서열을 절단하는 ‘비표적 절단’ 가능성도 높게 나타났다.

*제한효소 제한효소는 DNA의 특정 염기서열을 식별하고 이중사슬을 절단하는 효소를 뜻한다. 정식 명칭은 제한핵산내부가수분해효소(restriction endonuclease)다. 스위스 생물학자인 베르너 아르버가 대장균에서 제한효소의 존재를 처음 확인하고 이름 붙였다.
[Cover Story - part 1. HISTORY] 유전자 편집을 위한 도구 ‘유전자가위’, 어떻게 발전해왔나
박테리아의 적응면역반응에서 고안된 3세대 유전자가위
2012년에는 편집 효율을 획기적으로 높인 3세대 유전자가위인 ‘크리스퍼 카스 9(CRISPR-Cas9)’이 등장했다. FokⅠ을 대신하는 제한효소인 Cas9을 사용한다.

Cas(CRISPR Associated endonuclease) 단 백질은 박테리아의 적응면역반응인 ‘크리스퍼 시스템’에서 특정 바이러스 DNA를 절단하는 제한효소의 한 종류다. 목표 특정 염기서열을 인식하는 역할은 가이드RNA가 담당한다.

에마뉘엘 샤르팡티에 박사는 크리스퍼 시스템에서 Cas9과 크리스퍼 RNA(CrRNA) 외에도 트레이서RNA(Tracr RNA)가 존재한다는 사실을 밝혀냈다. 이후 제니퍼 다우드나 UC버클리 교수와 함께 크리스퍼RNA와 트레이서DNA를 결합시켜 단일가이드RNA(sgRNA)를 만들었다. 크리스퍼 Cas9 유전자가위에서 DNA의 표적을 인식하는 역할을 담당한다.

크리스퍼 Cas9은 일반적으로 20개의 염기서열을 인식할 수 있다. 징크핑거나 탈렌에 비해 인식할 수 있는 염기서열이 길다. 약 1조 개 이상의 서열을 구분할 수 있다. 인간 유전자 30억 쌍 중 중복돼 나타날 확률은 매우 희박하다. 무엇보다 사용 방법이 간단하고 비용도 저렴해서 동·식물의 품종개량과 다양한 신약 개발 등 여러 산업 분야에서 응용되고 있다.

크리스퍼 Cas9 유전자가위는 처음 발명된 이후에도 기술 발전을 거듭해왔다. 최근에는 더욱 다양한 유전자 교정이 가능한 베이스에 디터와 프라임 에디터 등이 등장하며 차세대 기술로 주목받았다.

하지만 크리스퍼 Cas9 유전자가위를 기반으로 응용한 기술이며 아직 크리스퍼 Cas9의 활용도가 높은 만큼 4세대로 분리하는 것은 이르다는 의견도 존재한다.

*크리스퍼 시스템 크리스퍼 시스템(CRISPR System)은 본디 박테리아(세균)의 적응면역체계를 의미한다. 사람이 바이러스에 감염되면 면역기억세포를 만들어 재감염에 대비하는 것처럼 박테리아도 바이러스의 재침입을 막기 위해 적응면역을 한다. 박테리오파지는 박테리아를 먹는(죽이는) 바이러스라는 뜻이다.

박테리오파지는 박테리아에 침입하기 위해 대상 세포에 바이러스 DNA를 주입시킨다. 이때 박테리아는 주입된 바이러스 DNA의 일부를 잘라서 저장한다. 훗날 같은 바이러스가 재침입하면 저장해둔 DNA 조각과 비교해 잘라낸다. 이 과정에서 특정 염기서열을 찾아내는 크리스퍼RNA와 찾은 DNA를 절단하는 효소인 Cas9이 짝을 이뤄 작동한다.

박인혁 기자

*이 기사는 <한경바이오인사이트> 매거진 2021년 12월호에 실렸습니다.