“생성형 AI GPT-4, 한의사 국가시험 통과 확인”

이선용 기자 | lsy419@kakao.com | 기사승인 : 2023-12-22 10:09:04
  • -
  • +
  • 인쇄
가천대 한의대 김창업 교수 연구팀, 특화된 프롬프트 엔지니어링으로 예측 성능 향상
 
[대학저널 이선용 기자] 생성형 인공지능 모델 GPT-4가 한의사 국가시험에 통과한 것으로 확인됐다.


특히 GPT-4 한의학 데이터에 대한 특별한 훈련 없이 한의사 국가시험을 통과하는 성능을 나타냈다.

가천대학교 한의과대학 김창업(사진) 교수 연구팀은 2022년 한의사 국가시험에 포함된 340문항을 GPT-4에 제시한 뒤 GPT-4의 정답률을 평가했다. 그 결과 GPT-4는 전체 문항 중 66.18%의 문항에 대해 정답을 맞추었으며, 각 과목에 대해서도 과목별 과락 기준인 40%보다 높은 정답률을 기록했다.

특히, 이번 연구에서는 프롬프트 엔지니어링에 따라 GPT-4의 성능이 합격/불합격에 영향을 미칠 만큼 성능에 큰 영향을 주는 것을 확인했다.

한국어로 된 문항을 그대로 입력하였을 경우에는 평균 정답률이 51.82%였던 것에 반해, 한의학 용어를 한자로 병기하였을 때에는 57.59%, 지시와 문제를 영어로 스스로 번역하여 풀게 하였을 경우는 63.65%로 상승했다.

또한, 같은 문항에 대해 반복적으로 답변을 얻은 뒤 답변 중 가장 빈도가 높게 등장한 답을 최종답으로 선택하는 자기일관성(Self-consistency) 기법을 사용하였을 경우 정답률이 66.18%로 높아지는 것을 확인했다.

김창업 교수는 “기존 연구에 비해 이번 연구에서는 프롬프트엔지니어링을 통해 한의학적 문제해결능력을 강화할 수 있다는 사실을 밝혔다는데 의의가 있다”며 “동일한 내용의 문제라도 어떤 언어로 사고하는지, 어떤 방식으로 사고하는지에 따라 큰 성능의 차이가 있었다는 데 주목할 필요가 있다”라고 밝혔다.

이 연구를 함께 수행한 장동엽 연구원은 “한국의 특수성을 반영하는 보건의약관계법규, 상한론-사상의학과 같은 과목들에서 낮은 점수가 나왔다는 것에 주목할 필요가 있다. 이는 GPT-4와 같은 글로벌 기업에서 구축된 AI가 한국의 특수성을 잘 반영하지 못할 수 있다는 점을 보여 준다”며 “추후 의료 인공지능 개발 시 각 지역의 특수성을 반영할 수 있는 노력이 필요할 것으로 보인다”라고 전했다.

 

[저작권자ⓒ 대학저널. 무단전재-재배포 금지]

뉴스댓글 >