八國聯軍攻輝達 UALink挑戰NVLink


當HPC算力到達一個高峰後,資料的傳輸能力變成下一個技術競爭的戰場,八大科技巨頭就怕整碗AI硬體商機都被輝達端走,只好硬著頭皮結盟對抗。

文/吳旻蓁

綜觀當前AI市場中,輝達(Nvidia)無疑是目前全球AI的主要領導者之一。其以遊戲顯卡起家,在過去的十年裡以黑馬之姿,從一家價值僅約一○○億美元的新創公司,茁壯成一間市值超越三兆美元的科技巨頭;且輝達崛起的速度在美股可以說是數一數二的,一年前市值還僅四○○○多億美元,短短一年時間就從一兆美元衝上三兆美元,不僅如此,近期市值更一度超越微軟(Microsoft)及蘋果(Apple)登頂寶座。

輝達憑藉其於一九九九年發明的圖形處理器(GPU),搖身一變成為「AI軍火商」,並在AI晶片領域享有九○%以上的市占;隨著全球對AI晶片需求的爆炸式增長,輝達的GPU早已是各界瘋搶的當紅炸子雞。


逐鹿AI,八巨頭結盟

當然,在龐大的AI商機面前,除輝達外,其他科技大廠亦想一爭寶座。近期美國八大科技巨擘包括英特爾(Intel)、超微(AMD)、博通(Broadcom)、思科(Cisco)、Google、慧與科技(HPE)、Meta及微軟(Microsoft)共組UALink推廣組織,將攜手開發新的互聯技術UALink,旨在提供高速、低延遲網路互連,且開放式的產業標準,運用開放協定促成加速器晶片之間的有效通訊,並能輕易擴增單一伺服器機櫃內的加速器晶片數量,同時提供運算密集工作負載的必要效能。

UALink促進小組就指出,隨著AI運算需求大增,企業需要能建立低延遲、高效率的向上擴充(scale-up)網路,以便為單一執行個體加入運算資源。UALink和產業規格目的即在為AI和機器學習、HPC和雲端應用的建立和實作,建立標準介面。

進一步來看,UALink提議的第一個版本「UALink1.0」將在單一運算「pod」中連接多達一○二四個AI加速器(僅限GPU)。UALink1.0基於「開放標準」,包括超微的無限架構,將允許AI加速器附加的記憶體之間進行直接載入和儲存,並且與現有的互連規格相比,總體上將提高速度並降低資料傳輸延遲的作用。簡單來說,UALink可以將大量加速器連接在一起,共同完成大規模計算任務。

UALink開放標準劍指輝達

此外,這八家公司預計第三季創建一個「UALink聯盟(UALinkConsortium)」,負責監督UALink規範的未來發展,UALink1.0也將釋出給屆時加入的企業,至於更高頻寬的升級版規格UALink1.1則預定第四季問世。超微資料中心解決方案總經理諾洛德(ForrestNorrod)表示,第一批UALink將在「未來年」推出。

UALink的問世可以說意在對抗輝達的NVLink技術,希望打破輝達的壟斷。根據外媒分析指出,輝達寡占AI加速器至少八○%至九五%市占率,且近乎掠奪式的高毛利,亦早就讓全美科技巨頭不安,因此這次的合縱手段,也被視為是「AI產業為了打破輝達壟斷地位所做的最新努力」。

輝達執行長黃仁勳先前受訪時就回應,NVLink已經發展到第五代,而UALink只是一個提案,在未來幾年內都無法與NVLink競爭;且黃仁勳亦表示,當UALink第一代推出時,NVLink可能已經發展到第七或第八代。而產業人士也認為,輝達的成功,並非只單在晶片本身,除有強大的GPU技術外,完善的軟體生態系統如CUDA平台,以及NVLink串聯頻寬,都是其他業者難以在短期內超越的「護城河」。

NVLink是輝達開發的一種高速GPU互連技術,主要目的是取代PCIe來提供更快的傳輸速度與溝通模式。回顧NVLink的發展,由於計算需求不斷增長之下,多GPU的系統配置越來越普及,然而,在此趨勢下,作為連結的PCIe之頻寬逐漸成為瓶頸,而為了速度更快、拓展性更強的互連,輝達於一四年的GTC大會上首次提出了NVLink技術,並於一六年發布了第一款搭載NVLink的產品P100,單個GPU具有一六○GB/s的頻寬,相當於PCIe3的五倍頻寬。


輝達護城河短期難超越

也就是說,NVLink可以讓GPU與GPU跳過CPU直接溝通,亦讓CPU與GPU的溝通模式變得更直接,並且同時藉由統一存取記憶體技術整合CPU與GPU的記憶體,能更有效的利用運算資源。簡單來說,NVLink是一個能夠在GPU與GPU之間以及GPU與CPU之間實現高速大帶寬直連通訊的快速互連機制。

而自NVLink問世以來,目前已發展到第五代,單個GB200Tensor核心GPU最高可支援十八個每秒速度一○○GB的NVLink連線,總頻寬可達每秒一.八TB,比前一代頻寬高出兩倍,超過第五代PCIe頻寬十四倍。另,NVSwitch是NVLink的關鍵推動者,透過NVLinkSwitch,NVLink連接可以跨節點擴展,以創建無縫、高頻寬、多節點GPU集群,有效形成資料中心大小的GPU。在NVLink發展的這十年時間中,輝達已奠定了自身大型多GPU運算系統的優勢基礎。

不過,雖說輝達已有多年構築起的護城河,但亦有機構分析師認為,UALink的出現是希望在乙太網路標準之上打造成本較低的技術,加上科技大廠急欲擺脫對輝達高度依賴的景況,因此UALink未來仍有打破輝達在AI資料中心網路中壟斷的可能性;且當前AI才正要蓬勃發展,因此隨著後市UALink逐步推進、系統製造商採用開放的產業標準後,行業內的競爭勢必更加激烈,也就是說,各家公司都仍有機會在此領域取得新的突破。至於對於用戶而言,這也意味著將有更多高性能、低成本的選擇可供使用。

由此來看,這場AI大戰可以說才正要開打,究竟輝達能否坐穩寶座,抑或是八國聯軍有望崛起,將無疑是市場未來一大焦點。


閱讀完整內容
先探投資週刊2024/7月 第2307期

本文摘錄自‎

八國聯軍攻輝達 UALink挑戰NVLink

先探投資週刊

2024/7月 第2307期