의료 분야의 AI: 새로운 연구에서는 의사 결정을 위해 GPT-4를 사용하는 의사의 가능성과 한계를 보여줍니다.

미네소타 대학교 의과대학, 스탠포드 대학교, 베스 이스라엘 디커니스 의료센터, 버지니아 대학교의 연구진으로 구성된 협업 팀은 JAMA Network Open 에 인공지능(AI) 대규모 언어 모델 시스템인 GPT-4를 의사들이 환자 진단에 얼마나 잘 활용하는지 연구했습니다.

이 연구는 가정의학, 내과, 응급의학과에서 미국에서 자격을 취득한 의사 50명을 대상으로 실시되었습니다.

연구팀은 의사가 진단 보조 도구로 GPT-4를 사용하더라도 기존 리소스와 비교해 임상 추론이 크게 향상되지 않는다는 사실을 발견했습니다.

기타 주요 결과는 다음과 같습니다.

  • GPT-4를 단독으로 사용한 경우 진단 성능 측면에서 상당히 더 높은 점수를 받았으며, 기존 진단용 온라인 리소스를 사용하는 임상의와 GPT-4의 도움을 받은 임상의의 성능을 능가했습니다.
  • 기존 진단 자원을 사용하는 임상의와 GPT-4를 사용하는 임상의를 평가했을 때, GPT-4를 추가해도 진단 성과에 유의미한 향상이 없었습니다.

"AI 분야는 급속히 확장되고 있으며 의학 내외에서 우리의 삶에 영향을 미치고 있습니다. 이러한 도구를 연구하고 이를 가장 잘 활용하여 제공하는 치료와 이를 제공하는 경험을 개선하는 방법을 이해하는 것이 중요합니다." 미시간 대학교 의대 교수이자 M Health Fairview의 병원 의사인 앤드류 올슨 박사의 말입니다.

"이 연구는 임상 실무에서 의사-AI 협업을 더욱 개선할 수 있는 기회가 있음을 시사합니다."

이러한 결과는 AI를 임상 실무에 통합하는 것이 복잡하다는 것을 보여줍니다.

GPT-4를 단독으로 사용했을 때 유망한 결과가 나타났지만, 임상의와 함께 진단 보조 도구로 GPT-4를 통합하는 것은 기존 진단 자원을 사용하는 것보다 크게 우수한 성과를 보이지 못했습니다.

이는 의료 분야에서 AI가 지닌 미묘한 잠재력을 시사하며, AI가 임상 실무를 가장 잘 지원할 수 있는 방법에 대한 추가 탐색의 중요성을 강조합니다.

또한, 임상의들이 이러한 도구를 사용하도록 어떻게 훈련받아야 하는지 이해하기 위해 더 많은 연구가 필요합니다.

협력 기관 4곳은 의료 분야에서 GenAI의 결과를 더욱 평가하기 위해 ARiSE라는 이름의 양안 AI 평가 네트워크를 출범시켰습니다.

이 연구는 고든 앤 베티 무어 재단에서 자금 지원을 받았습니다.


출처: https://www.sciencedaily.com/releases/2024/10/241028164534.htm

댓글 없음

아름다운 덧글로 인터넷문화를 선도해 주세요