解密!殺手級晶片新創Groq

讓黃仁勳豪砸200億美元的關鍵拼圖


當AI戰場轉向推論,輝達豪砸兩百億美元取得新創Groq的I(矽智財)授權,並將核心團隊納入麾下,這不只是一場防堵對手彎道超車的防禦作戰。

撰文‧王子承

優化高吞吐量(high throughput)和優化低延遲性(low latency),本質上,是相互衝突的兩件事。這,正是我們和Groq合作的原因。」在美國聖荷西的GTC大會現場,輝達執行長黃仁勳突然話鋒一轉,告訴現場聽眾,原以為無法兼得的魚與熊掌,其實可以同時出現在輝達最新的VeraRubin架構當中。

這道殺手等級的技術升級,來自輝達在二○二五年耶誕夜斥資兩百億美元取得技術授權的晶片設計公司Groq。黃仁勳當場宣布,未來採用Vera Rubin架構的機櫃,將有二五%導入以Groq技術打造的LP(語言處理器)機櫃。

為何長年宣稱GP(圖形處理器)U能解決所有問題的霸主輝達,願意砸下兩百億美元的天價,向一家估值近七十億美元的新創公司取得IP授權,並以最快速度推出晶片與最先進產品結合?

若以真實工廠產線來形容,輝達設計的GPU可一口氣吞下大批原物料,並加工轉化為極其精細複雜的產品,但這個製造機器將產品送出工廠的速度不夠快;LPU的作用,就像是能用最短時間,將產品魚貫送入客戶手中的輸送帶。若以黃仁勳勾勒的AI工廠設想情境,有家需委託AI模型廣泛搜集資訊、反覆模擬評估,自動做出投資決策的公司,若僅使用輝達機櫃,從產出Token到實際行動之間,可能經歷了數十奈秒延遲;在這看似不起眼的剎那,瞬息萬變的金融市場或許已發生變化,讓耗費大量算力產出的Token,變得無用武之地。此時,加入能將延遲降至最低的LPU,就能有效化解AI不夠即時的痛點。


▲原本在Groq任職的輝達產品行銷負責人匹茲,看好輝達GPU結合LPU,創造了最佳經濟效益、最多Token數量與最極限智慧的三贏局面。攝影·王子承

Groq
成立:2016年
創辦人:羅斯(JonathanRoss,現已加入輝達)
估值:69億美元(2025年輝達以200億美元授權核心資產、延攬團隊)
投資者:貝萊德、路博邁、思科、三星、Social Capital、老虎環球基金、D1 Capital、1789 Capital
主要業務:推論晶片LPU


「為推論而生」的新創
大學肄業鬼才 曾參與研發谷歌TPU


因此,創立於二○一六年的Groq,可說是一家「為推論而生」的新創公司,它設計的LPU晶片,可以完美填補輝達GPU的重要弱點。

Groq創辦人兼執行長羅斯(Jonathan Ross)更是大有來頭,在自行創業前,曾是谷歌(Google)自研AI晶片TPU(張量處理單元)團隊的創始成員之一。

從世俗角度來看,羅斯是個徹頭徹尾的程式設計鬼才,曾在紐約大學修習數學與電腦科學,大二那年就獲准修習博士課程。但不願被傳統教育體系束縛的他,選擇提前輟學加入谷歌,在紐約辦公室從事廣告軟體開發,並利用閒暇時段,設計出TPU最初的硬體架構。

不屑傳統價值的羅斯,一六年意識到傳統GPU在處理資料時,由於內部複雜的排程器與記憶體爭奪問題,經常導致計算卡頓問題,但他又不願意為單一科技巨頭打造特用晶片,因此離開谷歌創立Groq,打造出名為TSP的LPU前身架構。

Groq這套架構,捨棄了傳統AI晶片的動態排程,也就是先做好空間設計,再安排任務交通路線;改採編譯器、軟體優先的確定性靜態架構,也就是先替模型做好路線規畫,以及每個模型運作的功耗,再決定空間配置。

轉型AI基建供應商
推出雲端服務平台 迎LLM大爆發


然而,硬體新創的市場極為艱辛,讓Groq吃足苦頭,短短不到十年之間,就經歷了多次「生死攸關的挑戰」。

真正讓Groq迎來成長的,是二三年大型語言模型(LLM)爆發。

Groq投資人、TDK創投總裁紹維奇(Nicolas Sauvage)指出,早在他投資之初,羅斯就預見了龐大AI模型運作時,推論將成為最大瓶頸,進而確立了「透過創新晶片設計與晶片上內建記憶體方案,將推論成本降至零」的使命。

隨後,Groq推出雲端服務平台、收購AI解決方案新創Definitive Intelligence,從單純的晶片設計公司,轉型為AI基礎設施供應商。不過,即使架構再優秀,AI晶片終究是資本密集的硬體產業,從爭取先進製程與高階封裝產能,到自建資料中心,都不是缺乏大筆資金的新創公司玩得起的賽局。

一名熟知內情的供應商向本刊透露,Groq最初其實想找台積電代工先進製程晶片,但因公司規模與訂單量太小,無法說服產能滿載的台積電,因此轉而與三星合作至今。

當AI推論成為業界爭相投入的熱門領域,Groq的地位也隨之水漲船高,二五年甚至有媒體以「Groq能打敗輝達嗎?」作為談論話題。

面對異軍突起,但規模尚未成氣候的Groq,輝達沒有選擇強勢碾壓,反倒以史上最高的投資金額,將LPU技術完美融入自家機櫃。

但黃仁勳在GTC上宣布Vera Rubin架構就要納入LPU晶片,對許多人來說,節奏還是快得超乎預期。



與輝達從競爭變結盟
軟硬體協同設計 三個月就推出新晶片


原為Groq產品及行銷主管、在去年技術授權後轉任輝達產品行銷負責人的匹茲(Stuart Pitts),在GTC期間接受《今周刊》專訪指出,如果幾個月前,別人問起他AI推論的應用場景,他可能還會回答是聊天機器人或是語音對話,但輝達與Groq結盟後,一轉眼間「我們已經來到了AI推論的轉捩點。」他說。

「任何人都可以製造SRAM(靜態隨機存取記憶體)產品,但輝達的絕對優勢,在於極致的軟硬體協同設計。」匹茲對於輝達在取得Groq技術授權後三個月內,就設計出全新晶片,也感到振奮。

CUDA之父、輝達超大規模與高效能運算副總裁巴克(Ian Buck)分析,輝達如此投入,是因為將Groq的LPU技術視為應對下一代兆級參數模型的加速套件。LPU具備速度極快的SRAM與優秀的編譯器,精準時序的排程架構,能確保資料在幾奈秒內到位,支援每秒達千個Token的高速生成。

巴克進一步指出,透過包含LPU、GPU、CPU、NVLink、Spectrum、Connect X、DPU「七大晶片協同作戰」,原本需要數十個LPU機櫃才能消化的運算量,現在只需兩個機櫃就能做到。搭配VeraRubin機櫃,這座全新的Token工廠能提供高達三十五倍的Token產出,支援高達數百萬的輸入上下文龐大模型,黃仁勳預估,這為整個產業帶來了十倍的吞吐量成長機會。

「輝達的併購邏輯從來不是『為了變更強』,而是『為了防止對手變更強』,同時確保自己在AI全端(Full Stack)上的絕對主導權。」曾投資Mellanox、Groq兩家與輝達結盟公司的安卓樂資本董事長林家振,一語道破輝達過去幾次併購的戰略邏輯。

見證了Groq的跌宕起伏,匹茲總結了Groq的成功關鍵在於「編譯器優先、軟體優先的方法。」因為在AI推論時代,晶片製造商必須從能源、基礎設施、晶片到軟體層面進行全端整體設計,而不能僅專注於晶片本身。

用兩百億美元,輝達不僅築起一道令GPU如虎添翼、競爭對手難以跨越的障礙,更延攬進一批信仰全端整體設計的精英團隊,在未來的產品迭代進展上,握有更多籌碼。

…本文摘錄自 今周刊 2026/3月 第1527期
閱讀完整內容
今周刊2026/3月 第1527期

本文摘錄自‎

解密!殺手級晶片新創Groq

今周刊

2026/3月 第1527期