"한글자동색인및 키워드 검색시스템"개발...한국경제신문사

각종 한글 문헌정보들을 주제어에 따라 분류 검색해 데이터베이스화할 수 있는 시스템이 국내에서 개발됐다. 한국경제신문사 뉴미디어국 개발팀은 6년간의 개발기간을 거쳐 국내 언론사중 처음으로 "한글자동색인및 키워드 검색시스템"를 개발했다. 이 시스템은 컴퓨터에 저장된 대량의 한글문헌 정보 데이터베이스를 컴퓨터가 자동으로 색인 분류토록 하고 단어를 입력하면 원하는 자료를 단 몇초만에 검색해준다. 효과적인 검색시스템은 데이터베이스 프로그램의 핵심으로 여겨져 왔다. 그동안 국내에서는 기업 대학 연구소 언론사등이 컴퓨터를 통해 자료를 축적해 왔으나 마땅한 색인및 검색 시스템이 갖춰지지 않아 효과적인 데이터베이스 활용에 걸림돌이 돼왔다. 특히 외국의 데이터베이스 관리 프로그램은 우리 언어에 맞는 주제어 관리시스템을 내장하고 있지 않아 한글구조에 맞는 색인및 검색 시스템에 대한 요구가 꾸준히 제기돼왔다. 이 시스템은 문헌의 자동색인 처리를 위해 5종류의 전자단어 사전을 내장하고 있고 한글 문법에 맞는 총 12만여개의 단어를 표제어로 갖고 있다. 또 1만여개의 단어에 대한 동의어사전 기능이 들어있어 이용자가 맞춤법이 바뀐 단어나 비표준말 영문 약자 준말등을 입력하더라도 시스템이 해당 정보를 자동으로 인식해 보여준다. 이와함께 검색의 편의를 위해 찾아낸 문헌정보를 최신 날짜순이나 과거 날짜순등 시간대별로 분류해주며 단어의 중요도등에 따라 검색할 수 있다. 정보통신부의 "제조업 경쟁력 강화사업"중 하나로 개발된 이 시스템은 특허청등 대용량 자료 데이터베이스의 색인/검색용으로 채택돼 그 활용폭을 넓혀갈 것으로 예상된다. 특허청은 이 시스템을 활용해 특허및 실용신안 검색자료 데이터베이스를 구축중이다. 해마다 급증하고 있는 각종 특허 관련 정보를 주제에 따라 분류 정리해 심사업무에 활용하는 한편 일반인들에게 온라인으로 검색가능한 특허 데이터베이스를 제공할 예정이다. 한편 개발팀은 지난 88년이후부터 현재까지 한국경제신문에 게재된 33만여건의 기사를 데이터베이스화하고 오는 6월부터 일반에게 본격 서비스한다는 계획아래 지난달부터 시험운영에 들어갔다. (한국경제신문 1995년 2월 10일자).