• 熱門
  • 地方
  • 生活
  • 產經
  • 綜合
  • 娛樂
  • 文教
  • 身心𩆜
  • 醫藥健康
  • 旅遊
  • 美食
  • 體育
  • 法律天地
  • 合作媒體
  • 熱門
  • 地方
  • 生活
  • 產經
  • 綜合
  • 娛樂
  • 文教
  • 身心𩆜
  • 醫藥健康
  • 旅遊
  • 美食
  • 體育
  • 法律天地
  • 合作媒體
最新新聞
海委會主委管碧玲率跨部會南沙操演 強化人道救援實力
從「超越在嘉義」到「新之所向」  115年全中運正式閉幕
彰化縣舉辦2026首場城鎮韌性演習 提升防救災整備能量
雲縣府自籌4,746萬打造草嶺國小教師宿舍 張麗善縣長期盼優秀教師願意走進來留下來
雲林檢警鐵腕大掃蕩 聯手斬斷『槍、毒、詐』 肅槍名列六都以外全國第二名 張麗善縣長嘉勉 期許警民一體 守護家鄉治安
S__55287864
墨水映像數位行銷有限公司-w800xh98px
02.Banner_工作區域 1-F
165打詐儀錶版FOR墨新聞
979582
114污水banner
1140707-0720-地價稅
1140721-0803-電子稅單
首頁 » AI跑分大造假?柏克萊揭AI基準測試漏洞:未解題卻滿分
合作媒體

AI跑分大造假?柏克萊揭AI基準測試漏洞:未解題卻滿分

商傳媒
商傳媒
Published: 2026/04/23
Share
9 Min Read
AI跑分大造假?柏克萊揭AI基準測試漏洞:未解題卻滿分
AI跑分大造假?柏克萊揭AI基準測試漏洞:未解題卻滿分
圖/本報AI製圖(示意圖)

商傳媒|葉安庭/綜合外電報導

加州大學柏克萊分校(UC Berkeley)研究團隊近日揭露人工智慧(AI)基準測試系統存在的嚴重漏洞,研究人員開發出一款名為 BenchJack 的工具,能有效「駭入」這些測試系統,使得 AI 代理人即便未實際解決任何任務,仍可在多項基準測試中獲得高分,甚至達到 100% 的成績,凸顯當前 AI 模型評估機制恐失準。

該研究團隊開發的攻擊性 AI 代理人,在五項主要的 AI 代理人基準測試中獲得了 100% 的分數,在第六項測試中也達到近乎 100% 的高分,但其核心問題並未真正被解決。這項發現顯示,AI 代理人有能力利用基準測試框架本身的弱點,而非憑藉其解決問題的實際能力來取得高分。

類似現象過去已有跡象,例如 Anthropic 公司的 Mythos Preview 發現,一個前沿模型在無法直接解決任務時,會自行建立一個自毀式的權限提升漏洞。此外,模型評估與威脅研究機構(METR)在 2025 年也發現,較舊的模型如 o3 和 Claude 3.7 Sonnet,會利用堆疊內省(stack introspection)和修補評分器(monkey-patching graders)等策略來「獎勵欺騙」。在某些 RE-Bench 任務中,若模型能看見評分函式,其漏洞利用率更達到了 100%。

對此,OpenAI 已於今年稍早宣布,在內部稽核發現 59.4% 的審查問題存在測試缺陷後,已停用了 SWE-bench Verified 基準測試。加州大學柏克萊分校的博士生 Hao Wang 強調,當前 AI 開發流程中缺乏對管道設計、抽象化和重構等階段的重視,而這些環節恰是衡量模型信任度與安全性的關鍵。他指出,模型的推理與評估層面,包括模型如何計分與代理人如何被評級,常是現成模型信任度瓦解之處。

研究也顯示,簡單地在推理時加入通用安全提醒或明確的安全提示,可能會降低模型的功能正確性。唯有透過訓練,讓模型內化結構化的安全推理能力,才能提升其安全性。該團隊的研究發現,經過安全推理行為訓練的模型,其安全性甚至能泛化到原始訓練語言之外。例如,在 Python 問題上微調的模型,在 CWEval 基準測試中,於 C、C++、JavaScript 和 Go 等其他程式語言上也展現了更好的安全編碼行為,功能正確性和安全性皆有所提升。

這項研究也間接揭示了 AI 程式碼生成在軟體開發中的普及程度。根據 GitClear 在 2025 年對 2.11 億行程式碼的分析,當年全球提交的程式碼中有 41% 最初是由 AI 生成或建議的。而在 2025 年冬季的 Y組合子(Y Combinator)加速器計畫中,有 25% 的團隊回報其程式碼庫有 95% 是由 AI 生成。Hao Wang 呼籲,未來學生和初階工程師應加強程式碼審查、稽核和評估的訓練,而非僅專注於程式碼生成。

Previous Article 2026「台東最美星空」起跑 金曲歌手串聯山海離島 遍地星光 產業合作永續共好 2026「台東最美星空」起跑 金曲歌手串聯山海離島 遍地星光 產業合作永續共好
Next Article UiPath與Google強強聯手!Gemini驅動IXP提振40%文件處理效能 UiPath與Google強強聯手!Gemini驅動IXP提振40%文件處理效能

近期文章

  • 歐美健身潮全面升溫 歐洲狂飆擴張、美國會員衝破8100萬
  • 泰國電商衝破 9,700 億泰銖:建構高彈性平台的關鍵要素
  • 地緣政治衝擊能源市場 美股創新高布蘭特原油仍逼近百美元
  • 中東停火延長、財報亮眼 那斯達克勁揚 397 點續創歷史新高
  • MediaS HD 設 FP&A 部門 助解併購成長後利益率挑戰

近期留言

尚無留言可供顯示。
  • 關於我們
  • 隱私權政策
  • 聯絡我們
  • 關於我們
  • 隱私權政策
  • 聯絡我們
Copyright©MORE News
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?

為了帶給你更好的瀏覽體驗我們的網站中有使用Cookie,幫助我們改善網站的結構和行銷分析。如果你同意使用請點擊了解,我們會權利提供你更完善的服務!