이젠 성능보다 안전성이 핵심…B2B 시장 대세 된 모범생 AI

"이젠 성능보다 안전성이 핵심"…B2B 시장 대세 된 '모범생 AI'

황동진 기자

입력2024.10.22 17:33 수정2024.10.23 00:52 지면A14

IBM '그래니트 가디언' 공개
편견·보안 우회 등 사전에 차단

IBM이 안전성을 강화한 새로운 인공지능(AI) 모델을 출시했다. 기업들의 AI 도입이 확대되면서 주요 빅테크가 보안과 신뢰성에 방점을 둔 AI 모델을 잇달아 선보이는 모습이다.

IBM은 안전장치 AI 모델 ‘그래니트 가디언’을 22일 발표했다. 사용자의 명령어나 다른 생성형 AI의 답변에서 발생할 수 있는 위험 요소를 감지하는 데 특화한 모델이다. 사회적 편견, 증오, 유해성, 욕설, 폭력, 보안 우회 등 AI 활용 과정에서 나타나는 위험 요소를 사전에 탐지해 차단한다.

안전성 AI 모델은 다른 모델의 출력을 검토해 위험한 답변을 걸러내는 역할을 수행한다. AI 제품의 중심이 되는 파운데이션(기반) 모델은 성능 극대화에 집중하고 별개로 위험을 최소화하기 위한 안전 모델을 구축하는 식이다. 안전성 AI 모델은 서비스 개발·운영 과정에서 의도적으로 부적절한 명령어와 보안을 우회하는 프롬프트를 생성하는 용도로 쓰이기도 한다.

테크 기업들은 보안과 윤리에 중점을 둔 AI 모델을 연달아 내놓고 있다. 기업용 AI 시장에서 안전성이 핵심 경쟁력으로 떠오르고 있어서다. 메타는 지난해 AI 모델 출력을 모니터링하고 제어하는 ‘라마 가드’를 출시했다. 올해 4월과 7월엔 각각 ‘라마 가드2’와 ‘라마 가드3’를 발표해 성능을 고도화했다.

국내 AI 스타트업들도 AI 안전성 강화 제품 출시에 속도를 내고 있다. 튜닙은 6개의 보안 및 윤리 특화 모델을 통해 비윤리적 공격과 혐오 표현을 차단하는 솔루션을 제공한다. 콕스웨이브는 AI 모델의 취약성을 평가하고 잠재적 위협을 예방하는 ‘얼라인 AI’ 플랫폼을 운영 중이다.

황동진 기자 radhwang@hankyung.com

관련 뉴스

1

"AI가 내 업무 위협한다"…韓 35% 동의, 세계 2위

인공지능(AI)이 자신의 업무를 위협할 것이라는 우려가 한국에서 유달리 크다는 국제 조사 결과가 나왔다.3일 한국보건사회연구원이 주요 10개국 시민들을 설문조사한 보고서에 따르면 한국은 ‘AI 등 신기술로...
2

IBM, 中연구소 폐쇄

미국 정보기술(IT) 기업 IBM이 중국에서 연구개발(R&D)을 중단하며 1000명 이상을 해고한다고 홍콩 사우스차이나모닝포스트(SCMP)가 중국 계면신문을 인용해 26일 보도했다.지난 24일 계면신문은 IBM이 중...
3

금융·고령화…BoA가 추천한 '알짜 배당주'

‘서학 개미’(해외 주식에 투자하는 개인투자자)의 고민이 깊어지고 있다. 미국 주식시장이 이달 초 폭락장에서 빠르게 회복했지만 경기 침체와 미국 대선 등 불안 요소가 적지 않은 만큼 언제라도 주...