비전문의와 동등한 수준의 생성 AI 진단 능력

진단을 위한 생성 AI 활용은 의학 분야에서 주목을 받고 있으며, 이 주제에 대한 많은 연구 논문이 발표되었습니다. 그러나 각 연구마다 평가 기준이 달랐기 때문에, AI가 실제 의료 환경에서 어느 정도 활용될 수 있는지, 그리고 의사와 비교했을 때 어떤 장점을 가지고 있는지 파악하기 위한 종합적인 분석이 필요했습니다.

오사카 수도권대학 대학원 의학연구과의 히로타카 타키타 박사와 다이주 우에다 부교수가 이끄는 연구 그룹은 2018년 6월부터 2024년 6월 사이에 발표된 83편의 연구 논문을 사용하여 생성 AI의 진단 기능에 대한 메타 분석을 실시했습니다. 이 연구는 광범위한 의학 전문 분야를 다루었습니다.

분석된 대규모 언어 모델(LLM) 중에서 ChatGPT가 가장 일반적으로 연구되었습니다.

비교 평가 결과, 의료 전문가의 진단 정확도는 생성 AI보다 15.8% 더 높은 것으로 나타났습니다. 생성 AI의 평균 진단 정확도는 52.1%였으며, 최신 생성 AI 모델은 비전문 의사와 동등한 정확도를 보이는 경우도 있었습니다.

"이 연구는 생성 AI의 진단 능력이 비전문 의사와 동등하다는 것을 보여줍니다. 이는 의학 교육에 활용되어 비전문 의사를 지원하고 의료 자원이 부족한 지역의 진단을 지원할 수 있습니다."라고 타키타 박사는 말했습니다.

"AI의 역량을 검증하기 위해서는 더욱 복잡한 임상 시나리오에서의 평가, 실제 의료 기록을 활용한 성과 평가, AI 의사결정의 투명성 향상, 다양한 환자 그룹에서의 검증 등 추가 연구가 필요합니다."

해당 연구 결과는 npj Digital Medicine 에 게재되었습니다.


출처: https://www.sciencedaily.com/releases/2025/04/250418112808.htm

댓글 없음

아름다운 덧글로 인터넷문화를 선도해 주세요