"사용자 의도까지 꿰뚫어라"…'시맨틱 검색 기술' 경쟁 후끈

마이크로소프트 '빙' 이어 야후ㆍ구글ㆍSK컴스ㆍNHN 등 국내외 대형 포털 잇따라 가세
키워드 연관검색어 추천, 주제별 분류 예상 답변 제공 유저에 '맞춤 정보' 서비스

차세대 검색기술로 손꼽히는 시맨틱(의미 기반) 검색기술 경쟁이 뜨겁다. 지난해 선보인 마이크로소프트(MS)의 신개념 검색엔진 '빙'이 시맨틱 기술을 적용한 데 이어 야후,구글 등 글로벌 인터넷 기업들뿐 아니라 SK커뮤니케이션즈,NHN 등 국내 대형 포털들도 시맨틱 검색 경쟁에 뛰어들었다. 여기에 솔트룩스, 시맨틱스,코난테크놀로지 등 국내 벤처들도 가세했다.

◆사용자의 의도까지 파악한다'시맨틱'은 '의미 기반'으로 해석할 수 있다. 검색어의 의미를 파악해 그것에 담긴 사용자의 의도를 분석,가장 적합한 검색 결과를 제공하는 기술이라고 할 수 있다. 시맨틱이 차세대 검색으로 부상하는 것도 사용자 의도를 파악한다는 점 때문이다. 특정 단어를 입력했을 때 기계적으로 관련 문서만 찾아주는 게 아니라 사용자가 진정 의도한 바가 무엇인지를 고려해 다양한 가능성을 제시해주는 것이 시맨틱 검색의 요체다.

최근 검색 업체들이 시도하고 있는 '구문 분석 방식'과 '클러스터링 통계 방식'은 시맨틱 검색을 구현하기 위한 대표적 기술들이다. 클러스터링 방식은 주제별 자동 분류를 통해 검색어가 포함된 문서를 일렬로 보여주는 것이 아니라 분야별로 나눠 보여준다. 이미 국내의 큐로보,아울림 등에서 서비스 중이다. 동음이의어를 구분해 의미별로 분류된 정보를 제공하는 것이 기본이다.

구문 분석 방식의 경우 검색 대상이 되는 웹 콘텐츠에서 단어의 의미를 분석한다. 예를 들어 '출생'이라는 단어가 들어간 콘텐츠는 '인물의 프로필' 정보라고 인식하는 방식이다. 구글 스퀘어드나 MS에서 인수한 파워셋 등은 이 방식을 적용해 서비스 중이다. ◆시맨틱 검색,어디까지 왔나

시맨틱 검색은 아직 초보 단계이고, 업체들마다 적용하는 정도도 다르다. 어느 기업이 획기적으로 앞서 있다고 단언하기 힘든 상황이다. 하지만 가장 눈길을 끄는 것은 역시 MS의 검색 엔진 '빙'이다. 빙은 검색 결과 페이지의 왼쪽에 연관 검색어(Related Searches)들을 보여주는데 이는 키워드의 의미를 분석하는 시맨틱 기술을 적용한 것이다. 빙은 이러한 연관 검색어 추천을 통해 검색자의 의사결정을 돕는다는 의미에서 '의사결정 엔진(Decision Engine)'이라고 부르고 있다.

시맨틱 검색 기술을 도입한 구글 스퀘어드(www.google.com/squared)의 경우 특정 인물을 검색했을 때 이미지,생일,출생장소 등 키워드에 대한 정보를 주제별로 정리해 보여준다. 아직까지 콘텐츠 대상은 위키피디아와 같이 사전적으로 정리한 데이터베이스(DB)로 제한돼 있다. SK커뮤니케이션즈의 네이트가 지난 9월 말 내놓은 '시맨틱 검색'은 웹 콘텐츠 내의 단어와 문장을 분석해 정보를 주제별로 분류하고 질의어에 대한 예상 답변을 제공하는 형태다. 네이트는 시맨틱 검색을 통합 검색 내의 한 섹션으로 오픈했다. 기존 통합 검색으로 찾을 수 없었던 숨어 있는 정보를 찾는 보완적 서비스로 제공한 것이다. 네이트 시맨틱 검색의 경우 검색 키워드에 대한 결과를 주제별로 분류해 예상 답변과 함께 제공하기 때문에 원하는 검색 결과를 한 번에 찾기 쉽고 의도하지 않았던 새로운 정보를 접할 수 있다. 예를 들어 안젤리나 졸리를 검색할 경우 본명,출연작,수상내역,최근소식,사건사고,키,별칭 등 최대 50개까지 주제어가 제공된다. 왼편 주제어 옆으로 오른편에는 주제어에 대한 예상 답변이 보인다. '최근소식'이라는 주제어 옆으로 '안젤리나 졸리 영화 구찌 살인자'라는 예상 답변이 보인다. 상세 자료는 하단에서 확인해볼 수 있다. 얼마 전 '구찌'라는 영화를 찍었고 맡은 역할이 '살인자'임을 알 수 있다.

큐로보의 시맨틱 검색은 검색자가 이전에 어떤 정보를 주로 선택했는지를 DB화해 이용자에게 더욱 적합한 정보를 우선 제공하는 개인화 검색 방식이다. 큐로보에서 서비스하는 개인화 검색은 IP를 기반으로 검색자의 정보를 수집해 맞춤 정보를 제시한다. 검색자가 이전에 주로 본 콘텐츠가 건강,음악,정치 순이었다면 '이병헌'이라는 검색어에 대해서도 정보의 우선 순위와 비중을 기존 경향에 맞춰 조정하는 방식이다.

◆시맨틱,검색 지형 바꿀까해외에서 MS 등 검색 후발주자들이 시맨틱 검색에 더욱 적극적으로 나서는 것처럼 국내에서도 네이버,다음 등 1,2위 업체보다 SK컴즈,KTH 등 후발주자들이나 시맨틱스,솔트룩스 등 벤처기업들이 더욱 적극적으로 기술 개발에 힘쓰고 있다. 시맨틱 검색이 아직 개발 여지가 많은 분야이고,후발주자로서는 확실하게 차별화할 수 있는 요소가 있다고 판단하고 있기 때문이다.

특히 국내의 경우 2004년 통합 검색과 지식iN을 앞세워 검색 1위에 오른 네이버의 독주가 5년 넘게 이어지면서 후발업체들의 차별화 시도가 이어지고 있는 상황이다. 시맨틱스의 큐로보가 네이버보다 개인화한 서비스를 강화하는 데 주력한다면 SK컴즈 네이트의 시맨틱 검색은 검색어에 대한 정보를 주제별로 분류해 보다 다양한 의도에 기반한 검색 결과를 제공하고 있다.

SK컴즈 관계자는 "지난 5년간 커다란 변화 없이 양적 성장만을 계속해온 검색 시장이 바뀔 때가 됐다"며 "많은 정보만을 보여주던 검색을 벗어나 사용자의 의도와 목적에 좀 더 부합하는 검색이 대세가 될 것"이라고 말했다.

임원기 기자 wonkis@hankyung.com