
商傳媒|林昭衡/綜合外電報導
美國知名企業家馬斯克(Elon Musk)近日證實,其創辦的人工智慧新創公司 xAI 曾使用 OpenAI 的模型輸出資料來訓練自家的 AI 模型,此舉迅速引發業界對於 AI 數據使用倫理的廣泛討論。這項被稱為「汲取」(distilling)的行為,與 OpenAI 服務條款中明文禁止將其模型輸出用於訓練競爭性 AI 模型的規定相牴觸。
「汲取」是指利用一個較大型 AI 模型所生成的輸出結果,來訓練一個規模較小的 AI 模型。儘管訓練如 ChatGPT 或 Gemini 這類大型 AI 模型可能耗資超過 1 億美元,透過汲取技術,例如中國 AI 新創 DeepSeek 就聲稱其 R1 模型僅花費 29.4 萬美元便完成訓練,顯示此方法能大幅降低成本。
此前,OpenAI 於今年稍早便曾因懷疑有其他公司「汲取」其技術,而封鎖相關帳號,並點名 DeepSeek 利用 OpenAI 技術訓練開源模型。此外,另一家 AI 公司 Anthropic 也指控 DeepSeek、月之暗面(Moonshot AI)及 MiniMax 等中國公司,進行「工業規模」的行動,利用其 AI 模型 Claude 的能力來強化自身模型。Anthropic 聲稱,這三家公司透過約 2.4 萬個偽造帳號,與 Claude 進行了高達 1,600 萬次交流。Anthropic 強調,這些透過汲取方式訓練出的模型,可能缺乏必要的安全防護機制,導致惡意行為者得以利用其開發生物武器或執行網路攻擊。
面對這類指控,馬斯克則反駁指出,普遍而言,「AI 公司通常會汲取其他 AI 公司的技術」。他也進一步提到,Anthropic 去年曾因使用盜版書籍訓練其 AI 模型而遭訴訟,最終以 15 億美元達成和解。此言論暗示,AI 業界在數據來源方面普遍存在灰色地帶。