오브젠, 컨소시엄 꾸려 '금융 합성 데이터' 구축
입력
수정
오브젠은 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 공모한 2023년 인공지능 학습용 데이터 구축 지원 사업 '금융 합성 데이터'를 성공적으로 완료했다고 19일 밝혔다. 이번 사업은 오브젠을 주관사로 총 9개 산·학기관이 컨소시엄을 구성해 참여했다.
'금융 합성 데이터'란 실제 금융기관에서 활용되고 있는 데이터의 특성을 AI 알고리즘으로 학습해 기존에 접근이 어려웠던 '실제 금융 데이터'를 대체하는 '가상의 금융 데이터'다. 금융 합성 데이터는 상품개발, 위험관리, 마케팅 3대 분야에서 다양한 AI 모델 개발 시 학습 데이터로 활용될 수 있도록 공개될 예정이다. 이번 사업으로 구축된 금융 합성 데이터는 총 12종, 2700만건이 넘는다.
금융 합성 데이터 구축은 데이터 구성이 복잡, 방대하고 개인정보를 다루는 등 기술적으로 난이도가 필요한 작업이다. 오브젠 컨소시엄은 딥러닝 기술을 이용한 합성 프로세스를 자체적으로 정립해 900만건 이상의 다차원 시계열 데이터에 내재된 특징을 재현한 합성 데이터를 구축했다. 정확도를 담보하면서도 민감한 개인정보는 식별할 수 없도록 보호했단 게 특징이다.
회사 측은 이번 사업의 성공은 국내 데이터 산업 및 AI 산업 발전의 근간이 될 만큼 중요한 의미를 가진다고 자평했다. 이창민 NIA 수석연구원은 "금융 합성 데이터 구축 사업은 국내는 물론 세계적으로도 유례를 찾기 힘든 규모의 금융 데이터 합성을 성공적으로 수행한 사례"라고 말했다.사업책임자인 윤은영 오브젠 AI연구소 소장은 "그동안 네이버클라우드, NICE평가정보의 데이터를 결합한 솔루션을 개발하는 등 지속적으로 쌓아온 역량과 노하우가 집약된 결과"라고 말했다. 이어 "금융 합성 데이터 구축은 기업들이 내외부 데이터를 결합해 활용하는 새로운 방법으로, 금융뿐만 아니라 데이터가 부족해 AI 개발에 어려움을 겪고 있는 모든 산업 분야에 응용할 수 있다"고 덧붙였다.
신현아 한경닷컴 기자 sha0119@hankyung.com
'금융 합성 데이터'란 실제 금융기관에서 활용되고 있는 데이터의 특성을 AI 알고리즘으로 학습해 기존에 접근이 어려웠던 '실제 금융 데이터'를 대체하는 '가상의 금융 데이터'다. 금융 합성 데이터는 상품개발, 위험관리, 마케팅 3대 분야에서 다양한 AI 모델 개발 시 학습 데이터로 활용될 수 있도록 공개될 예정이다. 이번 사업으로 구축된 금융 합성 데이터는 총 12종, 2700만건이 넘는다.
금융 합성 데이터 구축은 데이터 구성이 복잡, 방대하고 개인정보를 다루는 등 기술적으로 난이도가 필요한 작업이다. 오브젠 컨소시엄은 딥러닝 기술을 이용한 합성 프로세스를 자체적으로 정립해 900만건 이상의 다차원 시계열 데이터에 내재된 특징을 재현한 합성 데이터를 구축했다. 정확도를 담보하면서도 민감한 개인정보는 식별할 수 없도록 보호했단 게 특징이다.
회사 측은 이번 사업의 성공은 국내 데이터 산업 및 AI 산업 발전의 근간이 될 만큼 중요한 의미를 가진다고 자평했다. 이창민 NIA 수석연구원은 "금융 합성 데이터 구축 사업은 국내는 물론 세계적으로도 유례를 찾기 힘든 규모의 금융 데이터 합성을 성공적으로 수행한 사례"라고 말했다.사업책임자인 윤은영 오브젠 AI연구소 소장은 "그동안 네이버클라우드, NICE평가정보의 데이터를 결합한 솔루션을 개발하는 등 지속적으로 쌓아온 역량과 노하우가 집약된 결과"라고 말했다. 이어 "금융 합성 데이터 구축은 기업들이 내외부 데이터를 결합해 활용하는 새로운 방법으로, 금융뿐만 아니라 데이터가 부족해 AI 개발에 어려움을 겪고 있는 모든 산업 분야에 응용할 수 있다"고 덧붙였다.
신현아 한경닷컴 기자 sha0119@hankyung.com