암호 풀지 않고도 데이터 분석…AI시대에 뜨는 동형암호 기술

테크 & 사이언스

데이터 활용·개인정보 보호
동시에 해결할 수 있어 주목

국내 신생기업인 디사일로
코로나 방역 솔루션까지 개발
유전체(DNA) 정보만 있으면 기대수명은 물론 탈모 가능성까지 알 수 있는 게 바이오정보 분석 기술의 진화상이다. 반대급부도 있다. 민감한 개인정보가 나도 모르게 노출되거나 악용될 수 있다는 점이다. 내 카드 이용 내역을 통해 고품질 금융서비스를 받는 것은 좋지만 개인 소비 내역까지 내주는 조건일 때 느끼는 ‘찜찜함’이 이런 문제를 상징적으로 말해준다. 다양한 데이터 가공 서비스가 등장하는 동시에 개인정보 보호 이슈가 계속해서 불거지는 이유다.
동형암호(homomorphic encryption) 분석 기술은 이런 문제를 해결할 대안으로 관심을 모으고 있는 차세대 데이터 분석 기술이다. 암호화된 데이터를 풀지 않고도 정보 분석을 수행할 수 있다는 게 가장 큰 강점이다. 기존 데이터 분석은 암호키를 통해 데이터 암호를 풀고 연산한 뒤 다시 암호화하는 과정을 거쳤다. 암호가 풀리는 단계에서 데이터 유출이 발생하고 데이터 정보도 공개될 수 있다는 게 단점이다. 동형암호 기술을 적용하면 이를 방지할 수 있다. 보안 서비스와 암호분석 서비스가 동시에 가능해진다.가령 유전 데이터 암호를 풀지 않고 분석업체에 넘기면 업체는 동형암호 기술로 데이터를 풀지 않고도 연산 처리한다. 암호화된 개인정보이기에 유전정보가 유출되더라도 문제가 없다. 연산을 하는 업체도 실제 누구의 데이터인지, 데이터 값이 무엇인지 인지할 수 없다.

동형암호 기술은 지난 10년간 발전을 거듭했다. 2009년 IBM 연구원인 크레이그 젠트리가 동형암호의 기본 구조를 지닌 ‘완전동형암호’라는 아이디어를 제안하면서 동형암호 기술 연구가 시작됐다. 초기에는 1비트(bit) 연산에 30분 이상이 걸릴 정도로 비효율적이었지만 기초 알고리즘 연구, 데이터 처리 기술 노하우의 발전 등으로 처리속도가 10년 사이 약 10만 배 빨라졌다. 특히 동형암호 기술의 기초 코드를 담아 놓은 IBM의 ‘SEAL 라이브러리’는 기술 발전에 크게 기여했다는 평가를 받는다.

데이터 활용과 동형암호 기술 수요는 ‘커플’처럼 동반 증가할 것이란 전망이다. 데이터 확보가 필수인 인공지능(AI)산업이 급속 확장하면서 데이터 가치가 그 어느 때보다 중요해지고 있지만 개인정보 규제 환경은 갈수록 깐깐해지고 있어서다. 유럽 개인정보 보호 규정(GDPR)은 관련 데이터의 자유로운 수집과 활용을 규제하는 쪽으로 방향을 틀고 있다. 2018년 5월부터 2020년 5월까지 GDPR이 규정 위반 기업에 부과한 평균 과징금은 580억원에 달한다.한국도 성과를 내고 있다. 지난 10일 열린 국제 유전체(게놈) 정보분석 보안 경진대회 ‘iDASH 2020’에서 삼성SDS, 서울대, 디사일로가 ‘동형암호 기반 암종(癌種) 분석’ 부문에서 공동 1위를 차지했다. 특히 디사일로는 올해 2월 설립된 신생기업으로 예일대, 알리바바 등 오랜 기간 연구를 진행해온 글로벌 기업을 제치고 1위에 올라 업계를 놀라게 했다. 이번 대회의 과제는 주최 측이 제공한 900여 명의 암호화된 유전체 변이 데이터를 동형암호 기술로 분석하고 어떤 종류의 암을 암호화한 것인지 알아맞히는 것이었다.

동형암호 기술은 아직 연구개발 단계에 머물러 있지만 머지않아 상용화될 것으로 보인다. 디사일로는 동형암호 기술로 확진자의 사생활을 보호할 수 있는 코로나19 방역 솔루션을 개발했다. 확진자의 암호화된 동선 데이터와 솔루션 이용자의 동선을 동형암호 기술로 비교 분석하는 솔루션이다. 이승명 디사일로 대표는 “정부가 암호화된 확진자 동선을 제공하기만 하면 바로 실행 가능한 수준까지 개발을 완료했다”고 말했다.

구민기 기자 kook@hankyung.com