KAIST, 검색 속도 110배 빠른 'AI 반도체' 개발
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
전기및전자공학부 정명수 교수팀 연구성과
포털 추천 시스템, 광고, 이미지 검색 등 서비스는 마이크로소프트(MS), 메타, 알리바바 등 글로벌 정보기술(IT) 기업이 제공하고 있다. 이런 AI 서비스엔 매우 큰 데이터 셋과 이를 담을 수 있는 메모리, 그리고 AI 반도체가 필요하다.
KAIST는 전기및전자공학부 정명수 교수가 운영하는 컴퓨터 아키텍처 및 메모리 시스템 연구실이 '컴퓨트 익스프레스 링크(CXL)' 기술을 활용해 기존 검색엔진보다 111배 빠른 속도의 AI 반도체를 개발했다고 25일 밝혔다.
검색 서비스에서 사용하는 알고리즘 중 대표적인 것이 '근사근접 이웃탐색(ANNS)'이다. ANNS는 어떤 데이터든 '특징 벡터'로 변환해 표현할 수 있다. 특징 벡터는 데이터가 가진 특징 각각을 숫자로 나열한 것이다. 이들 사이 거리를 통해 데이터 간 유사도를 구할 수 있다.
벡터 메모리를 담는 방식은 크게 두 가지로 나뉜다. 압축해 메모리에 싣는 압축 방식과, 스토리지 방식이다. 데이터를 책, 메모리를 서재에 비유하면 압축 방식은 책의 내용을 요약해 더 많은 책을 서재에 꽂는 것이다. 스토리지는 책을 외부 도서관에서 갖고 와 서재로 꽂는 것에 비유할 수 있다.
CXL은 CPU와 가속기, 메모리 확장기 등을 연결하는 프로토콜이다. CXL을 통한 메모리 확장은 서재 바로 옆에 창고를 지어 책을 보관하는 것으로 이해하면 된다.
연구팀은 CXL-ANNS 프로토타입을 자체 개발해 MS, 메타 등의 ANNS 성능과 비교했다. 이들의 ANNS 대비 평균 111배 성능이 높았고, MS 상용 검색 서비스보다 92배 높은 성능을 보였다는 게 연구팀의 주장이다.
정명수 교수는 "이번에 개발한 CXL-ANNS는 기존 검색엔진의 문제였던 메모리 용량 제한 문제와 메모리 접근 시간 지연 문제를 해결했다"며 "빅데이터가 필요한 고성능 컴퓨팅, 유전자 탐색, 영상 처리 등 다양한 분야에서 활용이 기대된다"고 말했다.
이번 논문은 오는 7월 열리는 컴퓨터시스템 분야 국제학술대회 '유즈닉스 연례 기술 컨퍼런스 2023'에서 발표될 예정이다.
이해성 기자 ihs@hankyung.com
KAIST는 전기및전자공학부 정명수 교수가 운영하는 컴퓨터 아키텍처 및 메모리 시스템 연구실이 '컴퓨트 익스프레스 링크(CXL)' 기술을 활용해 기존 검색엔진보다 111배 빠른 속도의 AI 반도체를 개발했다고 25일 밝혔다.
검색 서비스에서 사용하는 알고리즘 중 대표적인 것이 '근사근접 이웃탐색(ANNS)'이다. ANNS는 어떤 데이터든 '특징 벡터'로 변환해 표현할 수 있다. 특징 벡터는 데이터가 가진 특징 각각을 숫자로 나열한 것이다. 이들 사이 거리를 통해 데이터 간 유사도를 구할 수 있다.
벡터 메모리를 담는 방식은 크게 두 가지로 나뉜다. 압축해 메모리에 싣는 압축 방식과, 스토리지 방식이다. 데이터를 책, 메모리를 서재에 비유하면 압축 방식은 책의 내용을 요약해 더 많은 책을 서재에 꽂는 것이다. 스토리지는 책을 외부 도서관에서 갖고 와 서재로 꽂는 것에 비유할 수 있다.
CXL은 CPU와 가속기, 메모리 확장기 등을 연결하는 프로토콜이다. CXL을 통한 메모리 확장은 서재 바로 옆에 창고를 지어 책을 보관하는 것으로 이해하면 된다.
연구팀은 CXL-ANNS 프로토타입을 자체 개발해 MS, 메타 등의 ANNS 성능과 비교했다. 이들의 ANNS 대비 평균 111배 성능이 높았고, MS 상용 검색 서비스보다 92배 높은 성능을 보였다는 게 연구팀의 주장이다.
정명수 교수는 "이번에 개발한 CXL-ANNS는 기존 검색엔진의 문제였던 메모리 용량 제한 문제와 메모리 접근 시간 지연 문제를 해결했다"며 "빅데이터가 필요한 고성능 컴퓨팅, 유전자 탐색, 영상 처리 등 다양한 분야에서 활용이 기대된다"고 말했다.
이번 논문은 오는 7월 열리는 컴퓨터시스템 분야 국제학술대회 '유즈닉스 연례 기술 컨퍼런스 2023'에서 발표될 예정이다.
이해성 기자 ihs@hankyung.com