• 熱門
  • 地方
  • 生活
  • 產經
  • 綜合
  • 娛樂
  • 文教
  • 身心𩆜
  • 醫藥健康
  • 旅遊
  • 美食
  • 體育
  • 法律天地
  • 合作媒體
  • 熱門
  • 地方
  • 生活
  • 產經
  • 綜合
  • 娛樂
  • 文教
  • 身心𩆜
  • 醫藥健康
  • 旅遊
  • 美食
  • 體育
  • 法律天地
  • 合作媒體
最新新聞
守護民眾健康實踐醫療平權 民生醫院全人全社區照護計畫獲肯定
職場霸凌成企業治理新課題 社團法人中華勞資法務顧問協會會長湯啓堯:預防機制是永續經營關鍵
「東岳.山海之門」啟動 串聯冷泉、舊鐵道與泰雅文化
酒駕男撞路邊車竟落跑還找友頂替 警拔槍破窗驚險逮人
4歲女童未上車即起步致跌倒 阿姨涉無照5項違規
S__117071907
S__115499013
S__55287864
墨水映像數位行銷有限公司-w800xh98px
02.Banner_工作區域 1-F
165打詐儀錶版FOR墨新聞
979582
114污水banner
首頁 » 防範強大AI風險 Google DeepMind揭示控制路線圖
合作媒體

防範強大AI風險 Google DeepMind揭示控制路線圖

商傳媒
商傳媒
Published: 2026/06/22
Share
5 Min Read
防範強大AI風險 Google DeepMind揭示控制路線圖
防範強大AI風險 Google DeepMind揭示控制路線圖

商傳媒|林昭衡/綜合外電報導

Google DeepMind 近日發布一份 AI Control Roadmap(AI控制路線圖),旨在強化內部強大 AI 代理人的安全性與管理。這份藍圖強調,除了透過對齊(alignment,即訓練模型使其行為符合預期)來保障 AI 的方式外,還需增設系統級的安全機制,以全面防範潛在風險。

該控制路線圖的核心理念之一是透過可信賴的 AI 監督者,對 AI 代理人的推論過程、實際行動與執行計畫進行全面監控。這些控制措施將根據風險程度進行調整,對於低風險行為,可能僅需延遲審查;但對於具有潛在危險性的行動,則會實施即時阻擋。Google DeepMind 表示,此概念借鑒了資安領域的經驗,因為資安領域早已深知「即使是可信賴的系統,也可能遭受入侵」的教訓。

未來的 AI 代理人架構預計將結合多種安全元素,包括模型評估(model evals)、存取控制(access control)、稽核日誌(audit logs)、沙盒(sandboxing,即在隔離環境中執行)以及由 AI 監督其他 AI 的機制。為確保這些控制措施的有效性,Google DeepMind 也定義了具體的衡量指標:覆蓋率(監控的代理人流量比例)、召回率(捕獲不良行為的比例)以及反應時間(系統阻止不良行為的速度)。

此發展也反映了整個產業對 AI 安全的重視,例如 OpenAI 的 Dean Ball 已加入該公司,領導一個 Strategic Futures team(策略未來團隊),專注於前瞻 AI 政策的制定。這顯示 AI 安全的焦點正從抽象的哲學探討,轉向更具體的資訊安全實踐。

Previous Article 新竹科技業員工跳槽調查升溫 企業徵信社服務如何選擇 新竹科技業員工跳槽調查升溫 企業徵信社服務如何選擇
Next Article 2026 DCC中華朵蕾美廚藝盃落幕 敏實科大狂奪5金7銀閃耀國際 2026 DCC中華朵蕾美廚藝盃落幕 敏實科大狂奪5金7銀閃耀國際

近期文章

  • 守護民眾健康實踐醫療平權 民生醫院全人全社區照護計畫獲肯定
  • 職場霸凌成企業治理新課題 社團法人中華勞資法務顧問協會會長湯啓堯:預防機制是永續經營關鍵
  • 新竹榮家端午慰訪住院榮民 攜手榮服處關懷社區傳遞溫暖能量
  • 「全聯17載公益不停步 送暖北榮新竹分院弱勢病患」
  • 不熟悉路況 不慎將車開上了水溝

近期留言

尚無留言可供顯示。
  • 關於我們
  • 隱私權政策
  • 聯絡我們
  • 關於我們
  • 隱私權政策
  • 聯絡我們
Copyright©MORE News
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?

為了帶給你更好的瀏覽體驗我們的網站中有使用Cookie,幫助我們改善網站的結構和行銷分析。如果你同意使用請點擊了解,我們會權利提供你更完善的服務!