Tai-Thai Times 台泰時報 - 字字正體，句句真心，連接台灣泰國與全世界

（台泰時報5月12日電）美國哈佛醫學院（Harvard Medical School）最新研究指出，OpenAI開發的大型語言模型「o1」，在急診病患診斷測試中的準確率，高於部分內科專科醫師。研究顯示，AI在醫療判讀領域的能力持續提升，但研究團隊也強調，目前仍無法完全取代真人醫師。

這項研究由哈佛醫學院與貝斯以色列女執事醫療中心（Beth Israel Deaconess Medical Center）共同進行，主要測試大型語言模型（LLMs）在急診醫療情境中的判讀與診斷能力。

研究團隊選用OpenAI的o1模型，並邀請2名內科專科醫師，共同分析76名真實急診患者的病例資料。之後，再由另外2名醫師進行交叉評估，但評審過程中不會告知答案來自AI或真人醫師，以避免主觀影響。

結果顯示，o1模型診斷準確率達67%，高於兩名內科專科醫師的55%與50%。研究指出，AI模型在未經特別醫療資料訓練情況下，僅依靠輸入的原始病例資訊，即能完成相對高準確度的診斷分析。

研究人員表示，此次測試顯示大型語言模型已具備相當程度的臨床推理能力，即使目前主要仍以文字資訊作為判讀基礎，但新一代AI模型已逐漸具備處理影像、聲音與多模態資料能力，未來醫療應用潛力受到關注。

不過，研究團隊也強調，AI目前仍無法直接取代醫師做出生死攸關的臨床決策。原因在於AI並不具備法律與倫理責任，也缺乏人類醫師在臨場判斷、溝通與整合病患狀況上的能力。

此外，研究也坦言，本次比較對象為內科專科醫師，而非真正第一線急診醫師，因此結果仍有一定限制。急診醫療核心任務不僅是疾病診斷，更包含快速評估病患是否有立即生命危險，以及安排後續醫療處置。

近年AI醫療應用快速發展，包括醫學影像判讀、病歷分析、藥物研發與臨床輔助系統等領域，均已有大量研究投入。不少醫療機構也開始測試AI輔助工具，希望提升醫療效率與降低醫師工作負擔。

分析認為，未來AI更可能扮演「醫療輔助工具」角色，協助醫師進行初步分析與資料整理，而非全面取代人類醫療專業。如何兼顧技術發展、醫療倫理與病患安全，也將成為全球醫療界持續關注的重要議題。

圖片來源：PostToday　

哈佛研究：AI急診判讀 準確率高於醫師