• 熱門
  • 地方
  • 生活
  • 產經
  • 綜合
  • 娛樂
  • 文教
  • 身心𩆜
  • 醫藥健康
  • 旅遊
  • 美食
  • 體育
  • 法律天地
  • 合作媒體
  • 熱門
  • 地方
  • 生活
  • 產經
  • 綜合
  • 娛樂
  • 文教
  • 身心𩆜
  • 醫藥健康
  • 旅遊
  • 美食
  • 體育
  • 法律天地
  • 合作媒體
最新新聞
衛生機關綜合考核 新竹縣政府衛生局勇奪2項大獎
2026第一屆高醫體系永續年會盛大登場 以ESG永續競爭力 定義醫療新價值
補教名師高國華解析命題邏輯答題關鍵細心謹慎 線上說明會爆滿
永續教科書以產學共創連結真實世界 在校園中培養未來永續行動人才
勞動節連假 搭乘公共運輸、幸福巴士優惠
S__55287864
墨水映像數位行銷有限公司-w800xh98px
02.Banner_工作區域 1-F
165打詐儀錶版FOR墨新聞
979582
114污水banner
1140707-0720-地價稅
1140721-0803-電子稅單
首頁 » 融合 Claude Opus、GLM 及 Qwen AI「縫合怪」模型輕巧勝過阿里巴巴 35B
合作媒體

融合 Claude Opus、GLM 及 Qwen AI「縫合怪」模型輕巧勝過阿里巴巴 35B

商傳媒
商傳媒
Published: 2026/04/22
Share
9 Min Read
融合 Claude Opus、GLM 及 Qwen AI「縫合怪」模型輕巧勝過阿里巴巴 35B
融合 Claude Opus、GLM 及 Qwen AI「縫合怪」模型輕巧勝過阿里巴巴 35B
圖/本報資料庫

商傳媒|責任編輯/綜合外電報導

Contents
  • 突破硬體限制 低功耗超越大型模型
  • 過度推理成瓶頸 仍具廣泛應用潛力

一名 AI 工程師 Kyle Hessling 近期透過結合多款頂尖大型語言模型(LLM),成功打造出一個 180 億參數的「縫合怪」(frankenmerge)模型。這款模型不僅能在消費級硬體上執行,其表現更超越了中國科技巨擘阿里巴巴(Alibaba)旗下更大規模的 350 億參數模型,展現了開源社群在 AI 技術整合上的巨大潛力。

根據《Decrypt》報導,Kyle Hessling 將來自 Jackrong 開發的兩個微調模型——Qwopus 3.5-9B-v3.5(融合了 Claude 4.6 Opus 的推理風格)以及 Qwen 3.5-9B-GLM5.1-Distill-v1(基於 z.AI 的 GLM-5.1 教師模型訓練)——以「直通式縫合合併」(passthrough frankenmerge)技術進行整合。他將前者的 0 至 31 層與後者的 32 至 63 層堆疊,形成一個總共 64 層的新模型。

突破硬體限制 低功耗超越大型模型

這項創舉面臨的挑戰之一是 Qwen 3.5 混合線性/全注意力架構,現有合併工具無法直接支援。Kyle Hessling 為此開發了客製化的合併腳本,並在初步合併後,透過 QLoRA 技術進行了 1,000 步的「修復微調」(heal fine-tune),以解決模型層邊界造成的混亂程式碼輸出問題。

最終誕生的 180 億參數模型在 44 項能力測試中通過了 40 項。最引人矚目的是,它在 Q4_K_M 量化後僅需 9.2 GB 的顯示記憶體(VRAM),理論上可在 NVIDIA RTX 3060 等相對平價的繪圖處理器(GPU)上運作。相較之下,阿里巴巴的 Qwen 3.6-35B-A3B MoE 模型需高達 22 GB 的 VRAM,但在測試中卻被 Kyle Hessling 的「縫合怪」模型超越。

過度推理成瓶頸 仍具廣泛應用潛力

然而,該模型也存在挑戰。測試發現,其在某些任務上會出現「過度思考」的現象,產生冗長的推理鏈,甚至達到令牌限制(token limits)。例如,要求模型生成一個貪食蛇遊戲的程式碼時,竟耗費超過 40 分鐘進行推理。這種傾向在 Qwopus 系列中已是已知問題,由於堆疊了兩個推理蒸餾模型,可能使此行為在特定提示下被放大。這對於希望在消費級硬體上運行嚴肅應用程式的用戶而言,可能成為日常使用上的瓶頸。

儘管如此,這項成就凸顯了開源社群的創新力量:一位匿名的開發者發布專業微調模型與訓練指南,另一位愛好者則利用客製腳本進行堆疊與修復,最終創造出一個比大型實驗室發布模型更小、性能更佳的模型。這款模型在發布的頭兩週內便累積超過三千次下載,顯示其廣受關注。這類「從底層解決方案到專業化」的開源協作模式,正逐步縮小個人專案與前沿部署之間的差距,讓更多開發者能夠參與其中。

Previous Article 綜藝跨足自媒體挑戰升溫 徐乃麟談節奏轉變與日常狀態管理 綜藝跨足自媒體挑戰升溫 徐乃麟談節奏轉變與日常狀態管理
Next Article 澳洲 Syenta 搶攻美國 AI 晶片 亞利桑那州設廠創 200 職缺 澳洲 Syenta 搶攻美國 AI 晶片 亞利桑那州設廠創 200 職缺

近期文章

  • 發芽馬鈴薯叩關惹議 政府圓謊窘態畢現
  • 學校午餐再升級 基隆八斗國小金黃小米飯、三杯山海味勇奪全國午餐大賽雙獎
  • 美國綠能產業逆轉勝!波士頓法官裁定聯邦政府不得阻撓風電開發
  • 瞄準 AI 遊戲與娛樂新創 Firstpoint VC 成立 5 千萬歐元基金
  • Coinbase 示警:權益證明區塊鏈面臨量子威脅 以太坊、Solana 在列

近期留言

尚無留言可供顯示。
  • 關於我們
  • 隱私權政策
  • 聯絡我們
  • 關於我們
  • 隱私權政策
  • 聯絡我們
Copyright©MORE News
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?

為了帶給你更好的瀏覽體驗我們的網站中有使用Cookie,幫助我們改善網站的結構和行銷分析。如果你同意使用請點擊了解,我們會權利提供你更完善的服務!