
商傳媒|林昭衡/綜合外電報導
兩項最新研究顯示,人工智慧(AI)在醫療高風險領域展現巨大潛力。其中,妙佑醫療國際(Mayo Clinic)開發的AI模型能大幅提升胰臟癌的早期偵測率;而哈佛醫學院等機構的研究則指出,先進的大型語言模型在診斷複雜臨床病例方面,已超越人類醫師與過往的AI系統。
妙佑醫療國際的研究團隊開發了Radiomics-based Early Detection Model(REDMOD)AI模型。這項已發表於《Gut》期刊的成果顯示,該模型能將放射科醫師在常規腹部電腦斷層掃描中偵測胰臟癌的敏感度提高兩倍。妙佑醫療國際表示,REDMOD能在腫瘤肉眼不可見的「視覺隱匿」階段發現疾病徵兆,此時仍有治癒的機會。該AI模型經獨立測試集驗證,可平均提前475天識別胰臟導管腺癌(pancreatic ductal adenocarcinoma)。研究結果指出,REDMOD將整體敏感度從39%提升至73%,若針對診斷前超過24個月的病例,其敏感度更高出近三倍。該研究資深作者、妙佑醫療國際放射科及核醫學專家Ajit Goenka表示,胰臟癌難以存活的主要障礙在於無法在可治癒階段發現病灶,而這項AI現能可靠地從外觀正常的胰臟中識別癌症特徵。
另一項由哈佛醫學院(Harvard Medical School)、貝斯以色列女執事醫療中心(Beth Israel Deaconess Medical Center)及史丹佛大學(Stanford University)等機構合作進行的研究則發現,OpenAI的o1-series模型預覽版在評估複雜的臨床病理案例時,表現顯著優於人類醫師和以往的大型語言模型。這項於4月30日發表在《Science》期刊的研究指出,該模型在《新英格蘭醫學雜誌》(New England Journal of Medicine)的臨床病理會議案例中,達到78.3%的正確診斷率。在挑戰性臨床病例中,模型首次提出的診斷有52%正確;若納入「可能有幫助」或「非常接近」的診斷,準確度更高達97.9%。對比GPT-4,o1-preview在70個案例中以88.6%的準確度勝過GPT-4的72.9%。研究人員強調,將AI整合至臨床工作流程,尤其是在時間緊迫、資訊匱乏的急診室,有助於減少診斷錯誤。
這些研究結果顯示,儘管在臨床決策支援中應用AI仍被視為高風險,但更廣泛地使用這些工具,可能有助於減輕診斷錯誤、延誤以及缺乏醫療管道所帶來的人力與經濟成本。研究人員建議,醫療系統應準備投資運算基礎設施,並設計有利於醫護人員與AI互動的介面,以安全地將AI工具整合到病患照護流程中。這包括開發強健的監測框架,以確保AI臨床決策支援系統的廣泛實施,涵蓋安全性、效率和成本等關鍵指標。