AI內容安全再進化 ditto–ai推4B模型即時辨識多語言不良資訊

商傳媒
5 Min Read
AI內容安全再進化 ditto–ai推4B模型即時辨識多語言不良資訊
AI內容安全再進化 ditto–ai推4B模型即時辨識多語言不良資訊
圖/本報AI製圖(示意圖)

商傳媒|責任編輯/綜合外電報導

人工智慧(AI)安全與內容審核領域迎來新突破。新創公司 ditto–ai 近期推出一款名為「qwen3guard-gen-4b」的 AI 安全模型,該模型擁有 40 億參數,專為高效能內容分類設計,能將 AI 內容區分為「安全」、「不安全」或「具爭議性」三大類別。

這款 qwen3guard-gen-4b 模型具備支援全球 119 種語言的審核能力,可有效運用於多語系環境中。相較於現有大型替代方案,例如 Llama-Guard-3-8B,其較小的 40 億參數規模,能在維持強大分類效能的同時,實現更快的推論速度,對於需要即時內容審核的高流量系統而言,具備極高的實用性。

ditto–ai 表示,qwen3guard-gen-4b 模型採用獨特的雙輸入能力,不僅能審核使用者的指令(prompt),也能同時監控 AI 助理的回應(response)。透過此功能,模型能偵測內容是否觸發 AI 助理的拒絕模式,並提供詳細的內容分類資訊,確保人工智慧系統的安全性與合規性。

該模型應用範圍廣泛,可協助社群平台、聊天應用程式及 AI 服務提供商,在內容發布前進行篩選,以減少有害資訊的傳播。此外,企業可將其整合至客服聊天機器人,預先過濾不安全的指令,並監控模型產出的內容,有效維護服務品質與用戶安全。該模型亦可用於現有對話的稽核,或建立跨用戶互動的安全報告,對於提升 AI 應用的內容安全標準至關重要。