最新新聞

人民團體應該如何解散（下）？

柯震東新片《我未許願先吹蠟燭》北影亞洲首映

張孝全王丹妮跨國劇集《苦力》台北電影節 3 集首映

《世界的主人》北影首映場完售導演尹佳恩大讚「台灣觀眾太優秀」

姜育恆北流開唱歌迷華麗打扮走紅毯共創盛宴傳奇吳奇隆現身合唱紅蜻蜓

AI內容安全再進化 ditto–ai推4B模型即時辨識多語言不良資訊

Published: 2026/03/27

5 Min Read

AI內容安全再進化 ditto–ai推4B模型即時辨識多語言不良資訊

AI內容安全再進化 ditto–ai推4B模型即時辨識多語言不良資訊 — 圖／本報AI製圖（示意圖）

商傳媒｜責任編輯／綜合外電報導

人工智慧（AI）安全與內容審核領域迎來新突破。新創公司 ditto–ai 近期推出一款名為「qwen3guard-gen-4b」的 AI 安全模型，該模型擁有 40 億參數，專為高效能內容分類設計，能將 AI 內容區分為「安全」、「不安全」或「具爭議性」三大類別。

這款 qwen3guard-gen-4b 模型具備支援全球 119 種語言的審核能力，可有效運用於多語系環境中。相較於現有大型替代方案，例如 Llama-Guard-3-8B，其較小的 40 億參數規模，能在維持強大分類效能的同時，實現更快的推論速度，對於需要即時內容審核的高流量系統而言，具備極高的實用性。

ditto–ai 表示，qwen3guard-gen-4b 模型採用獨特的雙輸入能力，不僅能審核使用者的指令（prompt），也能同時監控 AI 助理的回應（response）。透過此功能，模型能偵測內容是否觸發 AI 助理的拒絕模式，並提供詳細的內容分類資訊，確保人工智慧系統的安全性與合規性。

該模型應用範圍廣泛，可協助社群平台、聊天應用程式及 AI 服務提供商，在內容發布前進行篩選，以減少有害資訊的傳播。此外，企業可將其整合至客服聊天機器人，預先過濾不安全的指令，並監控模型產出的內容，有效維護服務品質與用戶安全。該模型亦可用於現有對話的稽核，或建立跨用戶互動的安全報告，對於提升 AI 應用的內容安全標準至關重要。

Previous Article 韓國四大律所聚焦熱門議題探討產業法律挑戰與市場趨勢

Next Article 愛丁堡大學釋出2026/27遠距碩士獎學金限英聯邦國家公民