• 熱門
  • 地方
  • 生活
  • 產經
  • 綜合
  • 娛樂
  • 文教
  • 身心𩆜
  • 醫藥健康
  • 旅遊
  • 美食
  • 體育
  • 法律天地
  • 合作媒體
  • 熱門
  • 地方
  • 生活
  • 產經
  • 綜合
  • 娛樂
  • 文教
  • 身心𩆜
  • 醫藥健康
  • 旅遊
  • 美食
  • 體育
  • 法律天地
  • 合作媒體
最新新聞
高雄啤酒音樂節第二天不受颱風影響 李雅英、HUR+、范逸臣、派偉俊、告五人、MAMAMOO 的 Solar 頌樂及輝人 Whee In 繼續嗨唱高雄
第27屆台北電影節頒獎典禮 別錯過漏網美背鏡頭
第27屆台北電影節頒獎典禮在臺北市中山堂舉行 電影人美美盛裝出席圖輯
北影史上第一位外籍影帝 萬洛.隆甘迦《百衣蒼狗》封帝 高伊玲《我家的事》奪影后
CoCo李玟歌迷思念中相聚齊聲歌唱 溫馨舉行31週年紀念活動
1140707-0720-地價稅
1140721-0803-電子稅單
05.banner_工作區域 1 複本
S__48128050
墨新聞 MORE News > 合作媒體 > 微軟研究發現AI除錯失靈!Claude與OpenAI模型解Bug成效差強人意
合作媒體

微軟研究發現AI除錯失靈!Claude與OpenAI模型解Bug成效差強人意

商傳媒
Last updated: 2025/04/11 16:26
商傳媒
Share
6 Min Read
微軟研究發現AI除錯失靈!Claude與OpenAI模型解Bug成效差強人意
分享文章

微軟研究發現AI除錯失靈!Claude與OpenAI模型解Bug成效差強人意
商傳媒|記者責任編輯/綜合外電報導

Google執行長皮查伊(Sundar Pichai)指出,該公司目前有25%的新程式碼已由AI生成,Meta執行長祖克柏(Mark Zuckerberg)也公開宣示將全面部署AI編程工具。在科技巨頭爭相將「AI自動撰寫程式」導入產業應用的年代,科技媒體《TechCrunch》報導披露,一項由微軟研究部門(Microsoft Research)主導的分析卻揭示,當前最頂尖的AI模型在「除錯」表現方面仍遠遜於人類工程師。

微軟研究團隊以包含Anthropic的Claude 3.7 Sonnet與OpenAI的o3-mini在內的9種語言模型為測試對象,構建一個單一提示驅動(prompt-based)的AI代理系統,並賦予其多種除錯工具,如:Python除錯器,該系統被要求解決來自SWE-bench Lite基準的300項真實除錯任務,涵蓋程式錯誤識別、修復與邏輯調整。

結果顯示,表現最好的Claude 3.7 Sonnet僅完成48.4%的任務,OpenAI o1與o3-mini的成功率則分別落在30.2%與22.1%,明顯無法達到業界可接受的標準。研究團隊坦言,即便模型能力已大幅提升,距離實用除錯工具仍有相當落差。

造成低效能的主因之一,是模型在使用除錯工具時難以正確選擇並應用不同工具對應問題情境,反映其在序列化決策過程中的理解力仍有限。研究作者指出,當前AI訓練資料中,缺乏足夠的「人類除錯軌跡」(debugging trajectory)數據,是導致學習瓶頸的關鍵。

這項結果正呼應業界對AI撰寫程式工具的安全疑慮。例如AI開發平台Replit旗下的Devin模型,在20項程式測試中僅完成3項,顯示即便能生成語法正確的代碼,其邏輯完整性與維護性仍然堪慮。

專家建議,企業在導入AI輔助開發工具時,應審慎評估模型在「除錯、架構設計與安全性檢核」等方面的限制,並善用資深工程師進行二次審查,避免「系統性漏洞」導致將來造成更大損失。

分享此文:

  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 按一下即可分享至 X(在新視窗中開啟) X

請按讚:

喜歡 正在載入...
Previous Article 推動竹北市勝利七、八街第2階段配對單行道 竹縣府辦地方說明會 推動竹北市勝利七、八街第2階段配對單行道 竹縣府辦地方說明會
Next Article 美關稅衝擊! 中市府持續聆聽產業需求 5大建言積極研擬、為企業發聲 美關稅衝擊! 中市府持續聆聽產業需求 5大建言積極研擬、為企業發聲

近期消息

朱侯蔣齊反惡罷 砲轟抹紅分裂台灣 要用不同意票教訓賴清德 
朱侯蔣齊反惡罷 砲轟抹紅分裂台灣 要用不同意票教訓賴清德 
熱門
2025/07/05
藍營反惡霸 大咖痛批賴清德想在台灣當皇帝
藍營反惡霸 大咖痛批賴清德想在台灣當皇帝
熱門
2025/07/05
蔣萬安陪高虹安掃街 挺進新竹市抗惡罷
蔣萬安陪高虹安掃街 挺進新竹市抗惡罷
熱門
2025/07/05
韓國瑜南投草屯挺反罷 斥罷免完全沒天理
韓國瑜南投草屯挺反罷 斥罷免完全沒天理
熱門
2025/07/05
  • 關於我們
  • 隱私權政策
  • 聯絡我們
  • 關於我們
  • 隱私權政策
  • 聯絡我們
Copyright©MORE News
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?

%d
    為了帶給你更好的瀏覽體驗我們的網站中有使用Cookie,幫助我們改善網站的結構和行銷分析。如果你同意使用請點擊了解,我們會權利提供你更完善的服務!Ok