당신이 퇴사를 할지, 범죄를 저지를 지…그는 이미 알고있다 [긱스]
입력
수정
#떨리는 마음으로 면접장에 들어선 당신, 목소리를 가다듬고 이 회사에서 앞으로 내가 얼마나 중요한 역할을 할지, 그간 쌓아온 근거를 제시하며 면접관을 설득한다. 당신의 진심어린 노력과 달리, 회사는 당신을 탈락자로 분류한다. AI가 당신이 이 회사에 입사하면 3년 내 퇴사할 가능성이 70% 이상이라고 예측했기 때문이다.
#살인 미수 전과자 출신의 30대 남성이 슈퍼에서 식칼과 커다란 검은색 비닐 봉지를 구매했다. 이 남성은 인터넷에서 사체 유기 방법도 찾아봤다. 그 남성은 자택으로 돌아가는 길에 체포됐다. 소비행태와 인터넷 검색 내용을 분석한 AI가 이 남성의 잠재적 범죄 가능성을 90% 이상으로 판단한 것이다. 이들 사례는 먼 미래 얘기거나 소설 속에서나 등장하는 허구가 아닐 수 있다. 영화 ‘마이너리티 리포트’에서 예언자가 범죄자를 예측하는 ‘예방 치안’ 시스템을 선보인 것처럼 ’AI 예언자‘ 시대는 점차 현실화되고 있다. 데이터가 지속적으로 축적되고 이를 학습·분석하는 AI 기술이 고도화되면서 AI 예측의 정확도가 신뢰할 수 있는 수준으로 높아지고 있다. 활용 분야도 확대되고 있다. 기존에 보편적이었던 수요, 선호, 날씨 등의 분야뿐 아니라 최근에는 채용, 판결 등으로 다양화되고 있다.
그간 대면 면접은 개별 면접관에 따라 결과가 좌우되는 경우가 많았다. 표정 및 제스처 등 비언어적 소통이 포함된만큼 이를 데이터로 저장하기도 어려웠다. 데이터화가 가능한건 학벌, 시험성적 등 정량 스펙이 전부였다. 회사는 자체 개발한 AI 면접 솔루션을 통해 회사에서 필요한 역량을 검증할 수 있도록 했고 이를 데이터화했다. 면접 평가의 공정성뿐 아니라 객관적인 데이터까지 확보할 수 있게된 것이다.
제네시스랩은 한 기업의 학점, 학벌, 시험점수 등 15년치의 지원자 데이터를 토대로 입사 후 3년 뒤의 성과를 비교해 본 경험이 있다고 한다. 회사 관계자는 “회사의 요청에 의해 분석한 결과, 학점을 제외하고는 다른 정량지표는 고성과자와 유의미한 연관성이 없다는 것이 나타났다”고 설명했다.
이처럼 면접영상 데이터가 많이 쌓인다면 입사 시험에서부터 고성과자, 심지어 퇴사자까지 예측할 수 있다는 게 회사 측 설명이다. 이영복 제네시스랩 대표는 “아직 서비스로 도입할만큼 데이터가 충분하지 않지만 향후에는 유의미한 예측이 가능해질 것으로 보고있다“며 ”이 사람이 얼마나 일을 잘할지, 언제 떠날지 예측하는 것이 HR 서비스의 궁극이 될 것“이라고 말했다.
축구경기 분석 시스템 ‘스포츠AI’를 제공하는 팩트플러스는 머신 러닝을 바탕으로 축구 경기에 변수가 될 수 있는 모든 데이터를 수집·분석해 경기 결과를 예측한다. 유럽 축구 5대 리그와 UEFA 챔피언스 리그, 유로파리그, 각종 A매치 등이 분석 대상이다. 최근 4년 간 열린 6165경기를 분석하고, 예측한 결과 승패 적중률은 66.8%에 이른다. 노래 등 상업용 콘텐츠가 뜰 수 있을 지를 예측하는 AI 기술도 확산되고 있다. 데이터 기반 웹툰 제작사 오늘의웹툰은 작품의 상업적인 성과를 제작 극초기 단계에 분석할 수 있는 시스템을 ‘웹툰 애널리틱스’를제공한다. 지난 6월에는 500명 이상의 작가에게 직관적인 분석 결과를 바탕으로 서비스를 제공하기도 했다.
AI 작곡 스타트업 포자랩스도 역대 인기곡을 신곡의 성공 여부를 예측하는 서비스를 준비중이다. “특정 멜로디나 리듬 등 음악의 데이터를 분석해 기존 데이터에 비해 순위권에 들 수 있는지를 측정하는 서비스를 계획중“이라고 말했다.
다량의 회사들로부터 데이터를 축적한 이 회사는 최근 “우리는 ‘시그널’(Signal, 예측) 회사”라고 포지셔닝을 하고있다. 이들은 방대한 고객 리뷰 데이터를 토대로 ‘특정 유형의 고객의 90%는 3개월 후에도 유효 고객이다’, ‘이 고객은 3주 안에 떠난다’ 등의 방식으로 예측할 수 있다.
지난 5월 상하이증권거래소에 상장한 중국 AI 기업 클라우드워크스는 안면 인식 및 행동 패턴 통해 범죄 여부를 예측한다. 비전 AI 기술을 통해 사람의 복장, 체형, 모발 등을 분석해 행인의 신분을 인식해내고 현장 정보와 결합해 추적하거나 탐색해낸다. 얼굴을 인식하지 않고 의복, 머리카락, 체형 등 정보를 통해 신분을 인식해내고 위치를 추적할 수 있다. 미국 스타트업인 키트맨랩스는 웨어러블컴퓨터와 AI를 결합해 스포츠 선수들의 부상 가능성과 향후 성적을 예측한다. 센서가 달린 유니폼을 입고 운동경기를 하면 그 동작 등을 AI가 분석해 피로도와 신체부위별 잠재적 부상 여부를 감지한다. 동작을 어떻게 교정하는게 성적을 올리는 데 효율적인지도 파악한다.
지난 7월 영국 과학전문지 뉴사이언티스트에 따르면 미국 시카고대 연구팀의 인공지능(AI) 모델이 특정 범죄의 발생 1주일 전 90% 확률로 이를 예측했다. 시카고 시내를 일정 구획으로 나눈 뒤 AI에게 2014~2016년의 각 구획별 범죄 현황 데이터를 학습시켰고 이후 각 구획에서 살인, 강도 등 범죄가 일어날 확률을 분석한 결과, AI가 범죄 발생 1주일 전에 90%의 확률로 이를 예측했다. 다만 이 AI의 예측에 편견이 작용할 수 있다는 지적이 나왔다. AI가 작성한 예상 범죄 목록에는 시카고 내 20~29세 흑인 남성의 56%가 잠재적 범죄자로 올라 있었기 때문이다. 이는 결국 이들에 대한 경계로 이어지고 검거율도 이에 따라 늘어날 수 있다는 것.
해외에서 자주 사용되는 선거결과 예측도 우려의 시선이 있다. 미국 K코어 애널리틱스, 이탈리아 엑스퍼트AI 등 AI 기업들은 2016년에 이어 2020년 미국 대선 결과를 맞췄지만 이들은 예측을 사전에 공개하는 것이 유권자들에게 영향을 줄 수 있다는 것이다. 전문가들은 이같은 예측 기술과 관련해 미리부터 데이터 수집 방법에 대해 논의하고 점검할 필요가 있다고 보고있다. 윤세영 카이스트 AI 대학원 교수는 ”사회에 미치는 영향을 고려해서 기술개발해야 한다는 공감대는 자리가 잡힌만큼 학계에서는 학습에 사용되는 데이터를 어떻게 수집하는지, 어떤 선입관이 있을 수 있는지 논문에 명시를 하도록 하고있다“며 ”다만, 범죄 예측같은 민감한 부분은 아직 기술적으로도, 실제활용 단계에 오기까지 시간이 꽤 걸릴 것으로 보인다“고 말했다.
최다은 기자 max@hankyung.com
#살인 미수 전과자 출신의 30대 남성이 슈퍼에서 식칼과 커다란 검은색 비닐 봉지를 구매했다. 이 남성은 인터넷에서 사체 유기 방법도 찾아봤다. 그 남성은 자택으로 돌아가는 길에 체포됐다. 소비행태와 인터넷 검색 내용을 분석한 AI가 이 남성의 잠재적 범죄 가능성을 90% 이상으로 판단한 것이다. 이들 사례는 먼 미래 얘기거나 소설 속에서나 등장하는 허구가 아닐 수 있다. 영화 ‘마이너리티 리포트’에서 예언자가 범죄자를 예측하는 ‘예방 치안’ 시스템을 선보인 것처럼 ’AI 예언자‘ 시대는 점차 현실화되고 있다. 데이터가 지속적으로 축적되고 이를 학습·분석하는 AI 기술이 고도화되면서 AI 예측의 정확도가 신뢰할 수 있는 수준으로 높아지고 있다. 활용 분야도 확대되고 있다. 기존에 보편적이었던 수요, 선호, 날씨 등의 분야뿐 아니라 최근에는 채용, 판결 등으로 다양화되고 있다.
면접볼때부터...퇴사자 예측 가능하다?
AI 면접 솔루션을 제공하는 제네시스랩은 현재 300만개 이상의 면접 영상 데이터를 가지고 있다. 이들이 가진 것은 현대자동차, LG전자, 병무청 등 다양한 조직의 지원자 약 30만 명을 대상으로 한 데이터다.그간 대면 면접은 개별 면접관에 따라 결과가 좌우되는 경우가 많았다. 표정 및 제스처 등 비언어적 소통이 포함된만큼 이를 데이터로 저장하기도 어려웠다. 데이터화가 가능한건 학벌, 시험성적 등 정량 스펙이 전부였다. 회사는 자체 개발한 AI 면접 솔루션을 통해 회사에서 필요한 역량을 검증할 수 있도록 했고 이를 데이터화했다. 면접 평가의 공정성뿐 아니라 객관적인 데이터까지 확보할 수 있게된 것이다.
제네시스랩은 한 기업의 학점, 학벌, 시험점수 등 15년치의 지원자 데이터를 토대로 입사 후 3년 뒤의 성과를 비교해 본 경험이 있다고 한다. 회사 관계자는 “회사의 요청에 의해 분석한 결과, 학점을 제외하고는 다른 정량지표는 고성과자와 유의미한 연관성이 없다는 것이 나타났다”고 설명했다.
이처럼 면접영상 데이터가 많이 쌓인다면 입사 시험에서부터 고성과자, 심지어 퇴사자까지 예측할 수 있다는 게 회사 측 설명이다. 이영복 제네시스랩 대표는 “아직 서비스로 도입할만큼 데이터가 충분하지 않지만 향후에는 유의미한 예측이 가능해질 것으로 보고있다“며 ”이 사람이 얼마나 일을 잘할지, 언제 떠날지 예측하는 것이 HR 서비스의 궁극이 될 것“이라고 말했다.
법률, 스포츠,음원…궁극은 ‘예측’으로 통한다
국내의 다양한 AI 스타트업들이 기술력이 고도화되면서 AI 예측으로 나아가는 추세다. 이 대표는 “AI 기술이 ’싱귤래리티‘(특이점·AI가 인간 지능을 넘어서는 기점)를 향해 가고 있는데 제 생각엔 그 지점이 결국 ‘정확한 예측’으로 가는 것 같다”고 강조하기도 했다. 법률, 스포츠 분야에도 AI 예측 기술이 잇따라 도입되고 있다. ‘1분 재판’을 내세운 로이어드컴퍼니는 AI 기반 형량 예측 서비스를 제공한다. 이 기업은 형량 예측 적중도를 높이기 위해 가장 단순한 형태의 판결문도 최소 30개에서 최대 70개까지의 변수로 분해했다. 강제추행이라면 장소, 시간, 가해자 신체부위, 피해자 신체부위, 가해 행위 형태 등이 세분화돼 개별적으로 저장돼 있다. 이같은 정교한 데이터화 작업을 토대로 징역, 집행유예, 벌금, 선고유예 등 다양한 처벌에 대한 예측하는데 이에 대한 적중도가 91%를 웃도는 것으로 알려졌다.축구경기 분석 시스템 ‘스포츠AI’를 제공하는 팩트플러스는 머신 러닝을 바탕으로 축구 경기에 변수가 될 수 있는 모든 데이터를 수집·분석해 경기 결과를 예측한다. 유럽 축구 5대 리그와 UEFA 챔피언스 리그, 유로파리그, 각종 A매치 등이 분석 대상이다. 최근 4년 간 열린 6165경기를 분석하고, 예측한 결과 승패 적중률은 66.8%에 이른다. 노래 등 상업용 콘텐츠가 뜰 수 있을 지를 예측하는 AI 기술도 확산되고 있다. 데이터 기반 웹툰 제작사 오늘의웹툰은 작품의 상업적인 성과를 제작 극초기 단계에 분석할 수 있는 시스템을 ‘웹툰 애널리틱스’를제공한다. 지난 6월에는 500명 이상의 작가에게 직관적인 분석 결과를 바탕으로 서비스를 제공하기도 했다.
AI 작곡 스타트업 포자랩스도 역대 인기곡을 신곡의 성공 여부를 예측하는 서비스를 준비중이다. “특정 멜로디나 리듬 등 음악의 데이터를 분석해 기존 데이터에 비해 순위권에 들 수 있는지를 측정하는 서비스를 계획중“이라고 말했다.
투수 투구 폼 보면 승률 알 수 있다?
해외에서도 예측 서비스를 주력으로 하는 AI 기업 사례가 잇따르고 있다. AI미국의 테크기업 메달리아는 고객들의 목소리를 수집하는 B2B 서비스가 주요 업무였다. 앱스토어 리뷰, 이메일, SNS 등에서 피드백을 수집했다.다량의 회사들로부터 데이터를 축적한 이 회사는 최근 “우리는 ‘시그널’(Signal, 예측) 회사”라고 포지셔닝을 하고있다. 이들은 방대한 고객 리뷰 데이터를 토대로 ‘특정 유형의 고객의 90%는 3개월 후에도 유효 고객이다’, ‘이 고객은 3주 안에 떠난다’ 등의 방식으로 예측할 수 있다.
지난 5월 상하이증권거래소에 상장한 중국 AI 기업 클라우드워크스는 안면 인식 및 행동 패턴 통해 범죄 여부를 예측한다. 비전 AI 기술을 통해 사람의 복장, 체형, 모발 등을 분석해 행인의 신분을 인식해내고 현장 정보와 결합해 추적하거나 탐색해낸다. 얼굴을 인식하지 않고 의복, 머리카락, 체형 등 정보를 통해 신분을 인식해내고 위치를 추적할 수 있다. 미국 스타트업인 키트맨랩스는 웨어러블컴퓨터와 AI를 결합해 스포츠 선수들의 부상 가능성과 향후 성적을 예측한다. 센서가 달린 유니폼을 입고 운동경기를 하면 그 동작 등을 AI가 분석해 피로도와 신체부위별 잠재적 부상 여부를 감지한다. 동작을 어떻게 교정하는게 성적을 올리는 데 효율적인지도 파악한다.
AI 예언자, 어디까지 믿어야 하나
AI 예측 정확도가 높아질수록 논란의 여지는 많아질 전망이다. AI가 예측한 결과를 어디까지 공개하고 활용할 수 있을지 등 대한 논의가 필요하다는 시각이 지배적이다.지난 7월 영국 과학전문지 뉴사이언티스트에 따르면 미국 시카고대 연구팀의 인공지능(AI) 모델이 특정 범죄의 발생 1주일 전 90% 확률로 이를 예측했다. 시카고 시내를 일정 구획으로 나눈 뒤 AI에게 2014~2016년의 각 구획별 범죄 현황 데이터를 학습시켰고 이후 각 구획에서 살인, 강도 등 범죄가 일어날 확률을 분석한 결과, AI가 범죄 발생 1주일 전에 90%의 확률로 이를 예측했다. 다만 이 AI의 예측에 편견이 작용할 수 있다는 지적이 나왔다. AI가 작성한 예상 범죄 목록에는 시카고 내 20~29세 흑인 남성의 56%가 잠재적 범죄자로 올라 있었기 때문이다. 이는 결국 이들에 대한 경계로 이어지고 검거율도 이에 따라 늘어날 수 있다는 것.
해외에서 자주 사용되는 선거결과 예측도 우려의 시선이 있다. 미국 K코어 애널리틱스, 이탈리아 엑스퍼트AI 등 AI 기업들은 2016년에 이어 2020년 미국 대선 결과를 맞췄지만 이들은 예측을 사전에 공개하는 것이 유권자들에게 영향을 줄 수 있다는 것이다. 전문가들은 이같은 예측 기술과 관련해 미리부터 데이터 수집 방법에 대해 논의하고 점검할 필요가 있다고 보고있다. 윤세영 카이스트 AI 대학원 교수는 ”사회에 미치는 영향을 고려해서 기술개발해야 한다는 공감대는 자리가 잡힌만큼 학계에서는 학습에 사용되는 데이터를 어떻게 수집하는지, 어떤 선입관이 있을 수 있는지 논문에 명시를 하도록 하고있다“며 ”다만, 범죄 예측같은 민감한 부분은 아직 기술적으로도, 실제활용 단계에 오기까지 시간이 꽤 걸릴 것으로 보인다“고 말했다.
최다은 기자 max@hankyung.com