
(台泰時報5月12日電)美國哈佛醫學院(Harvard Medical School)最新研究指出,OpenAI開發的大型語言模型「o1」,在急診病患診斷測試中的準確率,高於部分內科專科醫師。研究顯示,AI在醫療判讀領域的能力持續提升,但研究團隊也強調,目前仍無法完全取代真人醫師。
這項研究由哈佛醫學院與貝斯以色列女執事醫療中心(Beth Israel Deaconess Medical Center)共同進行,主要測試大型語言模型(LLMs)在急診醫療情境中的判讀與診斷能力。
研究團隊選用OpenAI的o1模型,並邀請2名內科專科醫師,共同分析76名真實急診患者的病例資料。之後,再由另外2名醫師進行交叉評估,但評審過程中不會告知答案來自AI或真人醫師,以避免主觀影響。
結果顯示,o1模型診斷準確率達67%,高於兩名內科專科醫師的55%與50%。研究指出,AI模型在未經特別醫療資料訓練情況下,僅依靠輸入的原始病例資訊,即能完成相對高準確度的診斷分析。
研究人員表示,此次測試顯示大型語言模型已具備相當程度的臨床推理能力,即使目前主要仍以文字資訊作為判讀基礎,但新一代AI模型已逐漸具備處理影像、聲音與多模態資料能力,未來醫療應用潛力受到關注。
不過,研究團隊也強調,AI目前仍無法直接取代醫師做出生死攸關的臨床決策。原因在於AI並不具備法律與倫理責任,也缺乏人類醫師在臨場判斷、溝通與整合病患狀況上的能力。
此外,研究也坦言,本次比較對象為內科專科醫師,而非真正第一線急診醫師,因此結果仍有一定限制。急診醫療核心任務不僅是疾病診斷,更包含快速評估病患是否有立即生命危險,以及安排後續醫療處置。
近年AI醫療應用快速發展,包括醫學影像判讀、病歷分析、藥物研發與臨床輔助系統等領域,均已有大量研究投入。不少醫療機構也開始測試AI輔助工具,希望提升醫療效率與降低醫師工作負擔。
分析認為,未來AI更可能扮演「醫療輔助工具」角色,協助醫師進行初步分析與資料整理,而非全面取代人類醫療專業。如何兼顧技術發展、醫療倫理與病患安全,也將成為全球醫療界持續關注的重要議題。
圖片來源:PostToday
