
商傳媒|記者責任編輯/綜合外電報導
中國AI新創DeepSeek再度對矽谷投下震撼彈,該公司週一透過Hugging Face釋出最新實驗模型DeepSeek-V3.2-Exp,在現有V3.1-Terminus基礎上,進一步強化效率與降低運算成本,並引入名為DSA(DeepSeek Sparse Attention,稀疏注意力)的新功能,號稱能將AI長文本處理的成本減半。
Hugging Face中國社群負責人Adina Yakefu指出,V3.2的重大突破在於稀疏注意力,能讓模型更快處理長文件或長對話,同時成本僅為前一代的一半。The Futurum Group副總裁Nick Patience則認為,這將使AI更容易被中小企業、研究人員與開發者使用,可能推動新一波應用潮。
傳統大型語言模型往往「全盤考慮」資料,而稀疏注意力則會主動過濾被視為不重要的資訊,專注於最相關的部分。以航空公司規劃航線為例,AI會快速剔除不合理選項,縮短計算時間並節省資源。
不過,BlankPage Capital共同創辦人Almasque提醒,效率提升的同時,模型可能失去「細膩度」;若過濾機制錯誤,將關鍵資訊排除,結果可能偏差甚至危及安全性與公平性,Almasque直言:「這或許不是最安全或最佳的架構。」
DeepSeek去年突襲推出R1模型,號稱以低成本展現媲美頂尖對手的性能,試圖證明中國新創在晶片受限情況下仍能訓練強大模型,一度迫使字節跳動、阿里等同業降價。如今再推實驗版本,顯示該公司延續「高效低價」策略,挑戰美國OpenAI與Meta等科技巨頭的技術路線。
與此同時,業界也關注,DeepSeek屢次以「實驗架構」測試市場,但在安全性、可靠性與合規性上仍待驗證,尤其在AI被廣泛應用於醫療、金融與公共服務時,任何錯誤過濾都可能造成重大風險。