대학저널

성산26.5℃
이천21.5℃
서산22.7℃
경주시29.6℃
울릉도22.6℃
의성28.3℃
봉화23.3℃
북춘천21.5℃
거제24.0℃
동두천20.8℃
태백23.2℃
파주21.3℃
강진군23.7℃
인제19.8℃
서귀포25.9℃
북창원27.9℃
청송군28.5℃
진주27.9℃
장흥23.7℃
천안25.4℃
세종23.2℃
상주26.1℃
대관령19.7℃
울진24.4℃
양평22.7℃
광양시27.5℃
부여22.6℃
대구30.4℃
보령21.2℃
여수25.7℃
영천29.6℃
북부산27.4℃
영덕28.4℃
남해26.9℃
춘천21.2℃
고산25.5℃
수원21.6℃
목포22.6℃
전주22.5℃
양산시27.7℃
고창군23.0℃
장수21.6℃
충주23.0℃
의령군29.0℃
영월21.2℃
남원23.3℃
백령도17.8℃
부산23.7℃
안동25.2℃
구미29.5℃
울산28.0℃
청주24.2℃
진도군23.1℃
북강릉20.9℃
보은22.5℃
서청주23.9℃
원주21.5℃
포항30.7℃
금산22.9℃
대전23.1℃
영주24.5℃
광주23.7℃
강릉21.9℃
흑산도24.5℃
산청29.6℃
부안24.2℃
영광군22.7℃
홍성22.9℃
완도24.2℃
해남23.9℃
통영23.9℃
동해25.3℃
인천21.6℃
순창군22.2℃
순천23.0℃
제주25.8℃
군산22.4℃
창원26.9℃
추풍령25.1℃
함양군24.8℃
문경24.3℃
강화20.9℃
서울21.7℃
보성군25.0℃
합천29.1℃
정읍23.0℃
밀양30.0℃
정선군21.2℃
속초18.9℃
철원20.8℃
제천20.7℃
고흥24.3℃
고창23.1℃
홍천21.8℃
김해시25.6℃
임실22.9℃
거창25.9℃

“생성형 AI GPT-4, 한의사 국가시험 통과 확인”: 이선용 기자 | lsy419@kakao.com | 기사승인 : 2023-12-22 10:09:04

가천대 한의대 김창업 교수 연구팀, 특화된 프롬프트 엔지니어링으로 예측 성능 향상

[대학저널 이선용 기자] 생성형 인공지능 모델 GPT-4가 한의사 국가시험에 통과한 것으로 확인됐다.

특히 GPT-4 한의학 데이터에 대한 특별한 훈련 없이 한의사 국가시험을 통과하는 성능을 나타냈다.

가천대학교 한의과대학 김창업(사진) 교수 연구팀은 2022년 한의사 국가시험에 포함된 340문항을 GPT-4에 제시한 뒤 GPT-4의 정답률을 평가했다. 그 결과 GPT-4는 전체 문항 중 66.18%의 문항에 대해 정답을 맞추었으며, 각 과목에 대해서도 과목별 과락 기준인 40%보다 높은 정답률을 기록했다.

특히, 이번 연구에서는 프롬프트 엔지니어링에 따라 GPT-4의 성능이 합격/불합격에 영향을 미칠 만큼 성능에 큰 영향을 주는 것을 확인했다.

한국어로 된 문항을 그대로 입력하였을 경우에는 평균 정답률이 51.82%였던 것에 반해, 한의학 용어를 한자로 병기하였을 때에는 57.59%, 지시와 문제를 영어로 스스로 번역하여 풀게 하였을 경우는 63.65%로 상승했다.

또한, 같은 문항에 대해 반복적으로 답변을 얻은 뒤 답변 중 가장 빈도가 높게 등장한 답을 최종답으로 선택하는 자기일관성(Self-consistency) 기법을 사용하였을 경우 정답률이 66.18%로 높아지는 것을 확인했다.

김창업 교수는 “기존 연구에 비해 이번 연구에서는 프롬프트엔지니어링을 통해 한의학적 문제해결능력을 강화할 수 있다는 사실을 밝혔다는데 의의가 있다”며 “동일한 내용의 문제라도 어떤 언어로 사고하는지, 어떤 방식으로 사고하는지에 따라 큰 성능의 차이가 있었다는 데 주목할 필요가 있다”라고 밝혔다.

이 연구를 함께 수행한 장동엽 연구원은 “한국의 특수성을 반영하는 보건의약관계법규, 상한론-사상의학과 같은 과목들에서 낮은 점수가 나왔다는 것에 주목할 필요가 있다. 이는 GPT-4와 같은 글로벌 기업에서 구축된 AI가 한국의 특수성을 잘 반영하지 못할 수 있다는 점을 보여 준다”며 “추후 의료 인공지능 개발 시 각 지역의 특수성을 반영할 수 있는 노력이 필요할 것으로 보인다”라고 전했다.