• 熱門
  • 地方
  • 生活
  • 產經
  • 綜合
  • 娛樂
  • 文教
  • 身心𩆜
  • 醫藥健康
  • 旅遊
  • 美食
  • 體育
  • 法律天地
  • 合作媒體
  • 熱門
  • 地方
  • 生活
  • 產經
  • 綜合
  • 娛樂
  • 文教
  • 身心𩆜
  • 醫藥健康
  • 旅遊
  • 美食
  • 體育
  • 法律天地
  • 合作媒體
最新新聞
一次入圍4項大獎!嘉頌重奏團《樂脈》驚豔傳藝金曲
只要5秒!嘉市智慧口腔神器揪出牙菌斑 長輩潔牙一目了然
臺北市主打「Taipei, My Type」互動體驗 前進韓國搶攻MZ世代旅遊市場
泰國兩大旅遊協會頂尖業者訪問台中 盛讚綠美圖與舊城伴手禮魅力!
綠意莊園化身幸福加溫站! 中市單身聯誼17對有緣人甜蜜連線 創92%高配對率
S__118136958
S__117071907
S__115499013
S__55287864
墨水映像數位行銷有限公司-w800xh98px
02.Banner_工作區域 1-F
165打詐儀錶版FOR墨新聞
979582
首頁 » 印度新創Sarvam AI模型獲Google執行長盛讚 展現多語言處理實力
合作媒體

印度新創Sarvam AI模型獲Google執行長盛讚 展現多語言處理實力

商傳媒
商傳媒
Published: 2026/03/21
Share
6 Min Read
印度新創Sarvam AI模型獲Google執行長盛讚 展現多語言處理實力
印度新創Sarvam AI模型獲Google執行長盛讚 展現多語言處理實力
圖/本報資料庫

商傳媒|葉安庭/綜合外電報導

印度新創公司Sarvam AI近日獲得Google執行長桑德爾·皮蔡(Sundar Pichai)的高度肯定,其開發的人工智慧模型在處理印度多元語言和視覺理解任務方面展現卓越能力。該模型旨在深入發掘印度本地知識,並解決全球主流模型對印度語言支援不足的問題。

Sarvam AI的核心視覺語言模型(VLM)是一個高效能的3B狀態空間模型,不僅具備圖像標註、場景文字識別、圖表解讀及複雜表格解析等視覺理解功能,更在涵蓋22種官方印度語言的高品質資料集上進行訓練。據Sarvam AI執行長普拉蒂尤什·庫馬爾(Pratyush Kumar)指出,Sarvam Vision在olmcOCR-Bench(僅限英語子集)上達到84.3%的領先準確度,超越了Gemini 3 Pro等頂尖模型。

除了視覺理解,Sarvam AI的語音辨識模型支援10種印度語言,擁有7400萬個參數,僅佔約294MB的裝置空間。此模型能自動識別所說語言,並以約8.5倍於即時的速度處理語音,在Qualcomm Snapdragon 8 Gen 3晶片上的首次詞元生成時間少於300毫秒。其語音合成模型則有2400萬個參數和約60MB的裝置空間,可進行客製化語音複製,僅需約一小時的音訊資料即可部署。

此外,Sarvam AI的翻譯模型擁有1.5億個參數,在裝置上的佔用空間約為334MB。該模型能處理110種語言對的雙向翻譯,其中包括10種印度語言和英語,並且無需透過中介語言。這項技術對於解鎖實體文件、掃描檔案及歷史文獻中的印度知識至關重要。該公司於2023年8月成立,其文件智慧API曾免費提供至2026年2月,供使用者探索和建構Sarvam Vision應用。

Previous Article 美國50年首座大型煉油廠動土在即 川普宣示強化能源自主 美國50年首座大型煉油廠動土在即 川普宣示強化能源自主
Next Article AI科技浪潮衝擊人類尊嚴定義 哲學與倫理挑戰浮現 AI科技浪潮衝擊人類尊嚴定義 哲學與倫理挑戰浮現

近期文章

  • 微軟豪擲 25 億美元創立新事業 助企業攻克 AI 導入挑戰
  • 谷歌 Gemini AI 登陸 Drive 行動版 智能摘要與問答提升效率
  • 楊梅警暑假執行青春專案 一周查獲詐欺通緝犯26人
  • 【有片】扯!平鎮驚見保全「趴圍牆詭異顫抖」 警驗出喪屍煙彈陽性
  • 一次入圍4項大獎!嘉頌重奏團《樂脈》驚豔傳藝金曲

近期留言

尚無留言可供顯示。
  • 關於我們
  • 隱私權政策
  • 聯絡我們
  • 關於我們
  • 隱私權政策
  • 聯絡我們
Copyright©MORE News
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?

為了帶給你更好的瀏覽體驗我們的網站中有使用Cookie,幫助我們改善網站的結構和行銷分析。如果你同意使用請點擊了解,我們會權利提供你更完善的服務!