의사가 써본 챗GPT…"관건은 빅데이터·오진"




의료 산업에 대화형 인공지능 '챗GPT(ChatGPT)'가 본격적으로 도입된다면 어떨까요? AI(인공지능)는 의료계에서 활발하게 사용되고 있지만, 챗GPT가 실제로 도입되려면 아직 갈 길이 멀다는 게 지배적인 시각입니다.

IT·바이오부 김수진 기자와 함께 살펴봅니다. 김 기자, 의사와 함께 챗GPT에 대한 간단한 테스트를 진행했다면서요?

제가 직접 전문의들과 챗GPT를 함께 사용해봤는데, 첫 마디가 비슷했습니다. '생각보다 괜찮은데?' 였어요.

챗GPT가 미국의 의사시험에서 합격점을 받았다는 건 유명한 이야기입니다. 305개의 문항을 5초만에 풀었다고 하죠.

국내 헬스케어 기업에서도 챗GPT를 도입한 곳이 있다면서요?



비대면 헬스케어 플랫폼으로 잘 알려진 굿닥이 그렇습니다.챗GPT 기반의 AI챗봇 서비스를 내놨는데요, 건강과 관련해 사용자 질문에 몇 초 수준으로 빠르게 답변해줍니다.



생각보다 괜찮다고도 했고, 건강 Q&A에도 쓰일 정도면 믿어도 되나요?



의료계에서 보는 시각은 아직은 시기상조라는 게 지배적입니다.

사용해보니, 일반인이 의료 분야에서 챗 GPT를 너무 맹신하면 곤란할 것 같아요.

사실 미국의 의사시험 합격도 정답률은 60% 수준이었다고 합니다.

관련해 제가 의사와 함께 챗GPT를 직접 체험해봤는데요, 화면 먼저 보시겠습니다.

열과 콧물·가래가 있고, 목이 아프다며 챗GPT에게 무슨 병인지 물어봤습니다.

그런데 언어에 따라 답이 달랐습니다.

한국어 질문·답변에서는 감기와 코로나19일 수 있다고 말했지만, 영어에서는 감기에 대한 가능성만 제시했습니다.

이번엔 비만 치료약에는 뭐가 있냐고 물었습니다. 그런데 쓰이지 않는 약도 소개합니다.

[김양현 / 고대안암병원 가정의학과 교수 : (이건 원래 어디에 쓰이는 약물인가요?)스테로이드제는…비만 치료에는 오히려 반대로 살이 찔 수 있기 때문에 주의해야 하는 약물입니다. 잘못된 결과를 보여주고 있습니다.]

일부 대중에게 항암효과가 있다고 잘못 알려진 기생충약 '펜벤다졸'에 대해서는 암 치료에 사용된다는 틀린 정보를 알려줍니다.

[김양현 / 고대안암병원 가정의학과 교수 : 어떤 증상이 있을 때 병원에 가야 할지 말아야 할지, 상황 대처 방법에선 어느정도 도움이 될 수 있을 것 같고요. 챗GPT의 답변 자체를 맹신하거나 근거로 삼기엔 부족한 정도고요. 검색 조건이라던지 언어, 상황에 따라서 (정답인지 아닌지)다르게 나올 수 있습니다.]



결국 챗GPT의 답변이 정답에 근접할 수는 있지만, 실제 약 처방이라던지 이런 부분에서 위험할 수도 있겠네요.

게다가 의료 서비스는 환자마다 상황이 다 달라서 같은 해결책을 주는게 바람직하다고 보기도 어렵고요.



'환자 맞춤형'이 중요한 시대니까요.

그리고 급한 상황을 가정해서 챗GPT에게 질문했는데, 틀린 답을 줬어요.

예를 들어 바퀴벌레 약을 잘못 먹어서 급한 마음에 챗 GPT에게 물어본겁니다.

그런데 무언가 틀린 답을 줬어요. 따라했다가, 치명적인 사고를 당했다고 치면 누가 책임지나요?



책임 소재가 모호한 부분이 있네요. 다른 한계는 없을까요?



환자가 말하는 증상만으로는 정확한 판단이 어려운 병이 많습니다.

병원에 가서 혈액검사라거나, MRI·CT 검사 결과를 본 뒤에 이야기하자고 하는 경우 겪어보셨을겁니다.

이런 검사 결과 외에도, 의사가 보는 환자의 몸 움직임이라거나 얼굴, 말투 등에서도 질환의 단서가 있고요.

진단 뿐 아니라 치료의 영역에 들어가면 의사-환자 사이 신뢰도 역시 영향을 줍니다. 챗GPT가 할 수 없는 영역이죠.



이렇게 한계가 있다 해도, 앞으로 챗GPT가 발전하면서 분명히 의료에서도 더 쓰일텐데, 어떤 보완점이 필요할까요.



빅데이터 수집이 관건이라는 설명입니다.

아까 의료는 맞춤형 서비스가 중요하다고 했는데, 이를 위해서는 많은 환자 의료 정보가 필요합니다. 그리고 이런것들은 굉장히 만감한 개인정보기도 하죠.

정보 보호 없이는 활용 논의가 어렵다는 게 전문가들 의견입니다.

관련해 전문가 의견 들어보시겠습니다.

[권용진 / 서울대병원 공공진료센터 교수 : 의료를 대상으로 대화형 인공지능이 효과가 있으려면 교과서 수준을 넘어서, 개별 환자 사례에 대한 빅데이터를 충분히 가지고 있어야 합니다. 아직까지는 충분히 확보하지 못한 것 같아요. 우리나라 대형병원들을 빅데이터 클러스터로 만드는 방법이 있을 수 있습니다. 물론 그 전에 환자들에게 연구용으로 데이터가 사용될 수 있다는 동의를 구하는게 개인정보보호 차원에서도 적법한 절차라고 생각합니다.]



오늘 이야기 잘 들었습니다. IT·바이오부 김수진 기자였습니다.
김수진기자 sjpen@wowtv.co.kr