今年初,加拿大多倫多的一家晶片小廠Taalas引起了全球AI圈的關注。有業內人士認為,它很可能會撬動輝達主宰多年的AI晶片市場。Taalas發表了首款產品Taalas HC1晶片,這款晶片意外實現了每秒12,000 tokens的運算及推理速度,較輝達的主力產品H200和B200 GPU方案提升了48倍的能效。顯見,晶片市場正快速走向專業化、小眾化甚至個人化,且訂製化的趨勢日益明顯。
這裡我們要先解釋一下「Token」。Token就像是AI理解文字的小積木。每一個字、詞或符號都會被轉換成一個Token,再轉為數字供AI讀取。因為AI無法直接看懂文字,只能依靠數字去「算出」下一個最可能出現的詞。
當你輸入的每個字(輸入Token)和AI回覆的每句話(輸出Token)時,都會涉及運算成本。此外,還有推理Token(AI思考時所用)或快取Token(重複內容不重複計算),了解這些概念,就能明白為什麼有時候使用AI的費用會較高。
至於Taalas的技術與產品究竟有何特殊之處?是否能擔得起其自稱「世界上速度最快、成本和功耗最低的推理平台」?關鍵在於,Taalas將模型直接「刻」在晶片上。
在研究了HC1的相關公開資訊後,我們發現Taalas的技術路線與目前市場主流的ASIC路線相比,極具顛覆性。HC1可被視為「精簡版」的ASIC(特定應用積體電路)。
這一技術路線透過為特定應用場景量身訂製硬體設計,以追求極致的能效與成本效益。雖然其適用性、功能豐富度與可互換性遠低於能覆蓋多場景的GPU(圖形處理器),但野村證券預測,2026年ASIC晶片的總出貨量可能會首次超過GPU。一切顯示,晶片的發展將朝向個體化、專業化前進。
Taalas奉行「The Model is The Computer」——這也是該公司的標語——可理解為將傳統「在計算設備上運行模型」的模式,轉變為「模型本身即為計算設備」。與此同時,算力也擺脫了軟體束縛與編譯過程,數據幾乎不需要在記憶體與運算單元之間移動,「記憶體牆」因此消失,推理成本大幅降低,推理速度則顯著提升,這也代表新一代晶片正朝著省電的方向飛速邁進。
目前,Taalas已能透過結構化ASIC技術,將晶片訂製週期縮短至兩個月。由於後市前景看好,Taalas總計已融資2.19億美元,成功打造出這款擁有「極致專業化、速度與能源效率」的產品。(圖/翻攝新華社、央視新聞)
