[세계 컴퓨터 과학자대회] (인터뷰) 천순애 美 뉴욕시립대 교수
입력
수정
-좌담회에서 시맨틱 웹이 거론됐어요. 기술적 기반에 대해 설명해 주신다면.
▶시맨틱 웹의 핵심은 온톨로지(ontology)입니다.시맨틱 웹은 인공지능이 구현된 웹을 말하는데 인공지능을 만들기 위해서는 온톨로지가 필요합니다.
온톨로지는 개념과 개념을 연결해주는 '연관관계'를 표현하는 기술을 말합니다.
원래 온톨로지는 사물의 존재를 탐구하는 철학적 연구 영역을 의미했지요.최근에는 시맨틱 웹의 데이터베이스(DB)를 근본적으로 다시 꾸밀 수 있는 핵심 분야로 각광받고 있습니다.
비유하자면 사람이 언어를 습득하면서 '새'란 개념과 '날다'라는 개념을 연결시켜 '새=날아다니는 것'이란 그림,즉 연관관계를 머리 속에 떠올리는 것이 온톨로지입니다.
이런 개념을 컴퓨터도 이해할 수 있게 차근차근 가르치는 거죠.현재는 검색엔진의 기능을 획기적으로 향상시키는 데 초점이 맞춰져 있지만 온톨로지가 향후 컴퓨터나 모바일 기기의 다른 기능에 응용된다면 매우 편리해질 겁니다.-웹의 DB를 재편한다는 것은 무슨 뜻이고 어떤 의미가 있나요.
▶기존의 웹 엔진은 움직이지 않는 '정적'인 것이었습니다.
대부분의 콘텐츠가 하이퍼텍스트 전송언어(HTML)로 꾸며져 있었지요.HTML은 웹1.0 시대를 대변하고 있으며 구조화되지 않은 데이터(non-structured data)를 전송할 수 있었습니다.
확장성 생성언어(XML)는 웹2.0 시대의 특징인데 이 것은 절반 정도 구조화된 데이터를 꾸밀 수 있습니다.
시맨틱 웹은 이들이 진화한 것입니다.
구조화된 데이터를 갖고 혼자 이리저리 생각을 한다고 할까요.
시맨틱 웹을 웹3.0으로 부르는 것도 이 때문입니다.
다시 말해 기존 웹 서비스에 온톨로지 기술을 적용한 것이 시맨틱 웹입니다.
예를 들면 대법원 사이트에 들어가서 경매에 대한 정보를 얻는다고 합시다.
경매의 절차와 방법 등을 알고 싶다면 현재는 그게 어디에 나와 있는지 일일이 클릭을 하며 찾아야 하지요.
하지만 대법원 웹 DB에 시맨틱 웹 기술을 적용해 특정한 방향으로 재편한다면 얘기가 달라집니다.
검색창에 '경매 절차'를 치기만 하면 관련된 페이지로 인도해 주니까요.
-온톨로지 기술은 어떻게 활용되고 있습니까.
▶온톨로지는 대단히 많은 노동력을 필요로 합니다.
한 분야에만 온톨로지를 적용하려 해도 그 분야에 관련된 모든 정보를 축적해야 하니까요.
또 응용 컴퓨팅 분야에 대해 상당한 지식이 있어야 합니다.
그래서 과학자와 기업인들이 야심차게 프로젝트를 추진했다가 실패한 경우가 많았습니다.시행착오를 줄이기 위해 현재는 병원 경찰 등 특정 업무에 초점을 맞춰 부분적으로 프로젝트를 진행하고 있습니다.
특별취재팀=고기완 차장(팀장)/이해성/김보라/안상미/이미아/정호진/성선화/박민제/황경남 기자 dadad@hankyung.com
▶시맨틱 웹의 핵심은 온톨로지(ontology)입니다.시맨틱 웹은 인공지능이 구현된 웹을 말하는데 인공지능을 만들기 위해서는 온톨로지가 필요합니다.
온톨로지는 개념과 개념을 연결해주는 '연관관계'를 표현하는 기술을 말합니다.
원래 온톨로지는 사물의 존재를 탐구하는 철학적 연구 영역을 의미했지요.최근에는 시맨틱 웹의 데이터베이스(DB)를 근본적으로 다시 꾸밀 수 있는 핵심 분야로 각광받고 있습니다.
비유하자면 사람이 언어를 습득하면서 '새'란 개념과 '날다'라는 개념을 연결시켜 '새=날아다니는 것'이란 그림,즉 연관관계를 머리 속에 떠올리는 것이 온톨로지입니다.
이런 개념을 컴퓨터도 이해할 수 있게 차근차근 가르치는 거죠.현재는 검색엔진의 기능을 획기적으로 향상시키는 데 초점이 맞춰져 있지만 온톨로지가 향후 컴퓨터나 모바일 기기의 다른 기능에 응용된다면 매우 편리해질 겁니다.-웹의 DB를 재편한다는 것은 무슨 뜻이고 어떤 의미가 있나요.
▶기존의 웹 엔진은 움직이지 않는 '정적'인 것이었습니다.
대부분의 콘텐츠가 하이퍼텍스트 전송언어(HTML)로 꾸며져 있었지요.HTML은 웹1.0 시대를 대변하고 있으며 구조화되지 않은 데이터(non-structured data)를 전송할 수 있었습니다.
확장성 생성언어(XML)는 웹2.0 시대의 특징인데 이 것은 절반 정도 구조화된 데이터를 꾸밀 수 있습니다.
시맨틱 웹은 이들이 진화한 것입니다.
구조화된 데이터를 갖고 혼자 이리저리 생각을 한다고 할까요.
시맨틱 웹을 웹3.0으로 부르는 것도 이 때문입니다.
다시 말해 기존 웹 서비스에 온톨로지 기술을 적용한 것이 시맨틱 웹입니다.
예를 들면 대법원 사이트에 들어가서 경매에 대한 정보를 얻는다고 합시다.
경매의 절차와 방법 등을 알고 싶다면 현재는 그게 어디에 나와 있는지 일일이 클릭을 하며 찾아야 하지요.
하지만 대법원 웹 DB에 시맨틱 웹 기술을 적용해 특정한 방향으로 재편한다면 얘기가 달라집니다.
검색창에 '경매 절차'를 치기만 하면 관련된 페이지로 인도해 주니까요.
-온톨로지 기술은 어떻게 활용되고 있습니까.
▶온톨로지는 대단히 많은 노동력을 필요로 합니다.
한 분야에만 온톨로지를 적용하려 해도 그 분야에 관련된 모든 정보를 축적해야 하니까요.
또 응용 컴퓨팅 분야에 대해 상당한 지식이 있어야 합니다.
그래서 과학자와 기업인들이 야심차게 프로젝트를 추진했다가 실패한 경우가 많았습니다.시행착오를 줄이기 위해 현재는 병원 경찰 등 특정 업무에 초점을 맞춰 부분적으로 프로젝트를 진행하고 있습니다.
특별취재팀=고기완 차장(팀장)/이해성/김보라/안상미/이미아/정호진/성선화/박민제/황경남 기자 dadad@hankyung.com