• 熱門
  • 地方
  • 生活
  • 產經
  • 綜合
  • 娛樂
  • 文教
  • 身心𩆜
  • 醫藥健康
  • 旅遊
  • 美食
  • 體育
  • 法律天地
  • 合作媒體
  • 熱門
  • 地方
  • 生活
  • 產經
  • 綜合
  • 娛樂
  • 文教
  • 身心𩆜
  • 醫藥健康
  • 旅遊
  • 美食
  • 體育
  • 法律天地
  • 合作媒體
最新新聞
第37屆金曲獎流行音樂入圍揭曉 張惠妹很幸福也很感激 163braces(吳朵芸)只有「震驚」二字
第37屆金曲獎流行音樂入圍揭曉 入圍金曲的歌手紛紛興奮感言
迎接基隆 400 年「愛嶼搖滾」5月強襲基隆港 兩天42組超強卡司於三大舞台輪番熱力開唱
2026高雄啤酒音樂節卡司再加碼 台韓夢幻陣容全面解鎖
第37屆流行音樂金曲獎入圍名單今揭曉 屠穎 林煌坤榮獲特別貢獻獎 陳小霞《老翅膀》專輯榮獲評審團獎
S__115499013
S__55287864
墨水映像數位行銷有限公司-w800xh98px
02.Banner_工作區域 1-F
165打詐儀錶版FOR墨新聞
979582
114污水banner
首頁 » AI模型模擬人腦能力引爭議 浙江大學質疑「過度擬合」
合作媒體

AI模型模擬人腦能力引爭議 浙江大學質疑「過度擬合」

商傳媒
商傳媒
Published: 2026/03/25
Share
6 Min Read
AI模型模擬人腦能力引爭議 浙江大學質疑「過度擬合」
AI模型模擬人腦能力引爭議 浙江大學質疑「過度擬合」
圖/本報資料庫

商傳媒|林昭衡/綜合外電報導

針對人工智慧(AI)模型聲稱能模擬人類思考與決策能力,科學界近期浮現一場關鍵辯論。中國浙江大學研究團隊日前發表最新研究,對去年七月備受矚目的AI模型「Centaur」提出質疑,認為其表現恐源於「過度擬合」(overfitting),而非真正理解任務。

根據《SciTechDaily》報導,AI模型「Centaur」於2025年7月在國際期刊《Nature》發表時,曾引起廣泛關注。該模型建立於現有大型語言模型的基礎上,並透過心理學實驗數據進行優化,據其開發者宣稱,Centaur能在包含執行控制和選擇行為等160項不同認知任務中,複製出類似人類的反應。

然而,2025年12月11日發表於《National Science Open》的最新研究,則對Centaur的「人類認知模擬能力」投下疑問。浙江大學研究團隊指出,Centaur的表現很可能來自於對訓練數據中模式的記憶,而非真正的任務理解。為驗證此點,該團隊設計了一項實驗,他們將原本的多選題提示,替換為一項簡單的指令:「請選擇選項A。」

結果發現,Centaur並未依指令選擇「選項A」,反而繼續產生在原始數據集中被視為「正確答案」的回應。這項實驗結果暗示該模型未能理解指令的意圖。研究團隊強調,這凸顯了大型語言模型因其「黑盒子」(black-box)設計,在面對幻覺(hallucinations)和錯誤解讀等問題時的脆弱性。

這項研究進一步指出,Centaur模型最明顯的弱點在於語言理解能力,尤其未能掌握問題背後的真實意圖。科學界普遍認為,要實現真正的語言理解,仍是開發通用認知模型所面臨的最大挑戰之一。這場辯論也突顯出,在評估AI模型的真實能力時,必須進行更嚴謹且多面向的測試。

Previous Article 歐盟推工業加速法案 借鏡美國綠能供應鏈挑戰 歐盟推工業加速法案 借鏡美國綠能供應鏈挑戰
Next Article 澳歐自由貿易協定生效:澳洲葡萄酒業喜迎利多,肉品業者卻大失所望 澳歐自由貿易協定生效:澳洲葡萄酒業喜迎利多,肉品業者卻大失所望

近期文章

  • 索尼本世代投資逾百遊戲專案 強化PlayStation內容生態
  • 非洲科技市場告別模仿浪潮 在地化創新孕育兆元產品
  • 麻省理工團隊突破量子電腦可靠性瓶頸 找出電路失真根源
  • NASA傳奇女性計算機:安妮·埃斯利以手算開創太空時代
  • 傳承200餘年 萬和宮字姓戲開演

近期留言

尚無留言可供顯示。
  • 關於我們
  • 隱私權政策
  • 聯絡我們
  • 關於我們
  • 隱私權政策
  • 聯絡我們
Copyright©MORE News
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?

為了帶給你更好的瀏覽體驗我們的網站中有使用Cookie,幫助我們改善網站的結構和行銷分析。如果你同意使用請點擊了解,我們會權利提供你更完善的服務!