AI도 학습 포기했는데…의대생 필수강의 된 '日 사투리' [정영효의 인사이드 재팬]
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
혼슈 최북단 쓰가루사투리
'日서 가장 어려운 방언' 선정
죽·가려운·먹다·줘 등이 '게' 한글자로 표현
콜센터 상담원 애 먹자 AI통역 공동개발
'쓰가루사투리→표준어' 전환 불가
1년반 만에 포기
'日서 가장 어려운 방언' 선정
죽·가려운·먹다·줘 등이 '게' 한글자로 표현
콜센터 상담원 애 먹자 AI통역 공동개발
'쓰가루사투리→표준어' 전환 불가
1년반 만에 포기
죽(일본어로 '오카유'), 가려운(가유이), 먹다(구우), 드세요(다베테구다사이), 먹어(다베나사이), 먹어도 돼(다베테요이), 줘(죠다이), ~한다고 해(다소오다)
이 모든 단어가 일본 쓰가루 지역 사투리로는 '게(け)' 한 글자로 표현된다. 현지인들은 문맥과 억양으로 죽인지 가렵다는 뜻인지, 달라는 것인지를 구별하지만 다른 지방 사람들에게는 해독 불가다.
쓰가루지방은 일본 혼슈 아오모리현에서 동해에 면한 지역이다. 일본 본토 최북단 지역인 만큼 일본에서도 가장 외지고 독특한 문화가 남아있는 곳으로 통한다. 이 지역의 독특한 문화 가운데 하나인 쓰가루 사투리는 일본의 수많은 방언 가운데 가장 난해하다는 평을 받는다.
같은 쓰가루 지역이라 하더라도 바닷가와 산간지역, 남과북의 억양과 단어사용법이 또 제각각이다. 이 지역 출신 문호 다자이 오사무의 대표작 '인간실격'에도 처음 도쿄에 왔을 때 쓰가루 사투리 때문에 고생했다는 얘기가 나온다.
그 중에서도 최강의 사투리로 통하는 쓰가루 사투리는 인공지능(AI)도 포기한 언어다. 일본 동북지방 6개현(아오모리, 이와테, 아키타, 미야기, 야마가타, 후쿠시마)과 니가타현을 관할하는 도후쿠전력의 콜센터는 쓰가루 사투리 때문에 고민이었다. 콜센터 소속 상담원 상당수가 동북지방 출신인데도 쓰가루 사투리를 알아듣는 사람이 거의 없었기 때문이다.
이 때문에 도후쿠전력은 쓰가루 지역 중심 대학인 히로사키대학과 공동으로 AI를 활용한 통역의 공동개발을 추진했다. 쓰가루 사투리로 콜센터에 걸려온 문의전화 녹음 데이터를 AI에 학습시켜 통역으로 쓴다는 계획이었는데 1년반 만에 중단됐다.
AI에 음성을 인식시키는 것까지는 성공했지만 쓰가루 사투리를 표준어로 전환하는 것은 불가능했다. '게'의 사례에서 보듯 단어의 길이가 짧고 '아'와 '어' '우'와 '오'의 중간적인 발음이 많은 쓰가루 사투리의 벽을 넘지 못했다.
올 4월 도후쿠전력의 자회사는 AI에 의한 자동음성 전화대응을 개시했다. 대규모 정전 등이 발생했을 때 콜센터에 전화가 몰려도 고객들이 기다리지 않고 상담받을 수 있는 서비스였다. 하지만 쓰가루 사투리로 걸려온 문의 전화는 AI가 제대로 인식하지 못해 상담원에게 곧바로 연결하는 사례가 많다고 요미우리신문은 전했다.
히로사키대 의학부 출신 개업의인 사와다 요시히코가 강사로 나선다. 그는 요미우리신문에 "의사가 쓰가루 사투리에 굳어버리면 환자가 입을 다물게 돼 제대로 된 진료를 할 수 없다"고 설명했다.
도후쿠전력과 공동연구가 끝난 뒤에도 히로사키대는 독자적으로 쓰가루 사투리의 음성데이터를 수집하고 있다. 쓰가루 사투리를 후세에 남기기 위해서다. 쓰가루 사투리의 중심지인 아시가사와초의 인구는 2045년이면 5600명으로 지금의 60% 수준까지 줄어들 전망이다.
문제는 시간이다. AI에 언어를 습득시키려면 20만개 이상의 용례가 필요한데 히로사키대가 지금까지 수집한 용례는 1만개에 그친다.
도쿄=정영효 특파원 hugh@hankyung.com
이 모든 단어가 일본 쓰가루 지역 사투리로는 '게(け)' 한 글자로 표현된다. 현지인들은 문맥과 억양으로 죽인지 가렵다는 뜻인지, 달라는 것인지를 구별하지만 다른 지방 사람들에게는 해독 불가다.
쓰가루지방은 일본 혼슈 아오모리현에서 동해에 면한 지역이다. 일본 본토 최북단 지역인 만큼 일본에서도 가장 외지고 독특한 문화가 남아있는 곳으로 통한다. 이 지역의 독특한 문화 가운데 하나인 쓰가루 사투리는 일본의 수많은 방언 가운데 가장 난해하다는 평을 받는다.
같은 쓰가루 지역이라 하더라도 바닷가와 산간지역, 남과북의 억양과 단어사용법이 또 제각각이다. 이 지역 출신 문호 다자이 오사무의 대표작 '인간실격'에도 처음 도쿄에 왔을 때 쓰가루 사투리 때문에 고생했다는 얘기가 나온다.
◆AI 통역 공동개발 나섰지만
전국시대에는 각기 다른 나라였던 아오모리현은 쓰가루 사투리 외에 동부의 난부 사투리, 동북부의 시모키타 사투리가 다 다르다. 이 때문에 2019년 한 조사에서 아오모리현은 오키나와, 아키타, 이와테, 야마가타를 제치고 '일본에서 사투리가 가장 어려운 지역'으로 선정됐다.그 중에서도 최강의 사투리로 통하는 쓰가루 사투리는 인공지능(AI)도 포기한 언어다. 일본 동북지방 6개현(아오모리, 이와테, 아키타, 미야기, 야마가타, 후쿠시마)과 니가타현을 관할하는 도후쿠전력의 콜센터는 쓰가루 사투리 때문에 고민이었다. 콜센터 소속 상담원 상당수가 동북지방 출신인데도 쓰가루 사투리를 알아듣는 사람이 거의 없었기 때문이다.
이 때문에 도후쿠전력은 쓰가루 지역 중심 대학인 히로사키대학과 공동으로 AI를 활용한 통역의 공동개발을 추진했다. 쓰가루 사투리로 콜센터에 걸려온 문의전화 녹음 데이터를 AI에 학습시켜 통역으로 쓴다는 계획이었는데 1년반 만에 중단됐다.
AI에 음성을 인식시키는 것까지는 성공했지만 쓰가루 사투리를 표준어로 전환하는 것은 불가능했다. '게'의 사례에서 보듯 단어의 길이가 짧고 '아'와 '어' '우'와 '오'의 중간적인 발음이 많은 쓰가루 사투리의 벽을 넘지 못했다.
올 4월 도후쿠전력의 자회사는 AI에 의한 자동음성 전화대응을 개시했다. 대규모 정전 등이 발생했을 때 콜센터에 전화가 몰려도 고객들이 기다리지 않고 상담받을 수 있는 서비스였다. 하지만 쓰가루 사투리로 걸려온 문의 전화는 AI가 제대로 인식하지 못해 상담원에게 곧바로 연결하는 사례가 많다고 요미우리신문은 전했다.
◆'쓰가루 사투리 강의'가 의대생 필수과목
히로사키대 의학부는 2010년부터 1학년생 필수과목으로 '쓰가루 사투리' 강의를 진행한다. 의료현장에서는 의사소통이 필수이기 때문이다. 신입생 110명의 절반은 아오모리현 출신이지만 쓰가루 사투리를 이해하는 비율은 20~30%에 그친다는 설명이다.히로사키대 의학부 출신 개업의인 사와다 요시히코가 강사로 나선다. 그는 요미우리신문에 "의사가 쓰가루 사투리에 굳어버리면 환자가 입을 다물게 돼 제대로 된 진료를 할 수 없다"고 설명했다.
도후쿠전력과 공동연구가 끝난 뒤에도 히로사키대는 독자적으로 쓰가루 사투리의 음성데이터를 수집하고 있다. 쓰가루 사투리를 후세에 남기기 위해서다. 쓰가루 사투리의 중심지인 아시가사와초의 인구는 2045년이면 5600명으로 지금의 60% 수준까지 줄어들 전망이다.
문제는 시간이다. AI에 언어를 습득시키려면 20만개 이상의 용례가 필요한데 히로사키대가 지금까지 수집한 용례는 1만개에 그친다.
도쿄=정영효 특파원 hugh@hankyung.com