Nvidia與超微在今年CES展分別發表新款AI晶片,並勾勒未來人類的AI世界。黃仁勳認為,在AI融入日常生活,未來的工廠與日常生活,現實世界將與數位世界同步。蘇姿丰在演講中指出,未來是算力在指尖的世界,AI會像電力一樣,無所不在且唾手可及。
文/魏聖峰 人工智慧(AI)落地是2026 CES展的核心主題,全球兩大AI雙雄的Nvidia和超微因應未來AI的發展,黃仁勳在這次CES展的主題演講中傳達出的核心訊息是,AI從螢幕走出進入物理世界。蘇姿丰的演講聚焦於效能的民主化與AI的開放性。這兩場演講預告二○二六年之後,將面臨生產力的轉型、物理環境的智慧化以及運算主權的回歸,並將影響未來我們的生活。 黃仁勳在演講中指出,生成式AI從二二年第四季問世並廣泛被運用後,今天AI的發展已經有兩個平台轉變發生。第一個轉變是,應用程式建立在AI上;第二個轉變是,軟體開發和運行方式徹底改變。我們不再是編寫程式、而是訓練它,不再使用CPU運行,而是使用GPU。這意味著十兆美元的計算基礎設施正在現代化,並推動價值一百兆美元的產業轉向人工智慧。未來的AI需要理解物體的存在、因果關係、摩擦力、重力和慣性。我們必須創建一個系統,讓AI學習物理世界的常識,並學習其法則。現在AI已經完成在雲端大腦的訓練,現在它需要一個身體來進入物理世界。 為了達到這個目的,黃仁勳在今年CES展中正式發表Vera Rubin平台和Cosmos世界模型。Vera Rubin平台是實體的AI算力心臟,與前一代Blackwell相比,Vera Rubin的AI推理運算效能提升了五倍。實體AI走入物理世界前,必須先在虛擬環境(如Nvidia Omniverse或Cosmos)中進行大量訓練,Vera Rubin平台的極端運算力,讓AI能在數位孿生世界中模擬複雜的環境、物理碰撞與駕駛情境,使訓練出來的AI具備物理直覺,從而安全地走入現實世界。 Vera Rubin平台共發表六款晶片,包括Vera CPU、Rubin GPU、NVlink 6 Switch、COnnectX-9 SuperNIC、BlueField-4資料處理單元(DPU)以及Spectrum-6乙太交換器等。透過這六款核心晶片協同運作的AI運算平台,用來驅動超大規模AI訓練與推理工作負載,並且能夠維持資料中心、超級電腦、雲端服務與大型模擬部署的基礎設施。其中,Rubin GPU是這個平台的核心AI加速器和GPU,用在核心AI訓練與推論運算單元,提供大規模矩陣運算與張量處理能力,NVlink 6 Switch定位在高速GPU互連交換晶片,能允許GPU間以及極高頻寬進行資料交換與同步,有效支援大規模GPU置換,提高體系內部資料傳輸效率,減少運算瓶頸。
BlueField-4記憶管理能力 特別的是,BlueField-4資料處理單元是Vera Rubin平台中專門處理基礎設施任務與安全運算,擔任包括儲存、虛擬化、資料移轉與安全性管理的功能。這款DPU可在不干擾GPU/CPU情況下,加速底層網路與儲存任務,對處理大規模叢集的運算很關鍵。BlueField-4是為了讓未來的AI代理(如能夠自主推理、執行任務的AI協作夥伴)擁有更強大的記憶管理能力而設計的高階硬體平台,並非軟體層面的AI代理。但這並不表示將取代HBM,而是為了擴展記憶體層級,解決HBM容量不足且過於昂貴的問題。所以它與HBM是互補關係,來解決HBM容量瓶頸,能降低成本與提高平台的運作效率。 Cosmos世界模型是黃仁勳在這次演講中引以為傲的發表。這是一個專門為機器人設計的物理仿真大腦,它不再依賴人類標註的數據,而是透過觀察數百萬小時的現實影片,讓AI理解什麼是重力、什麼是硬度、什麼是因果關係。這是讓AI了解什麼是物理世界存在的法則。AI落地中,機器人是很重要的媒介。
從雲端到邊緣運算 至於未來的世界會是什麼樣貌?黃仁勳指出,現實世界與數位世界百分之百同步。在Nvidia與西門子合作的無人化智慧工廠中,每一座工廠在動工前,都會先在Nvidia Omniverse中運行一年。AI會模擬各種故障、物流瓶頸,甚至是地震等極端狀況,將Nvidia CUDA、AI模型和Omniverse深度整合到西門子整個工業生命周期內。當實體工廠建立時,它已經是進化後的版本,所有工廠內的機器人都已經在電腦中完成測試和評估,Nvidia與西門子已經在替未來的工業AI時代打造藍圖。這對人類會有什麼影響?人類將從體力勞動甚至是初級腦力解放,透過AI代理,每個人都擁有一個懂物理法則的特助,等於是把現在的科幻小說電影內容全部轉化為真實的人生。機器人幫人類寫電子郵件、控制與管理智慧家電、管理自動駕駛去接小孩放學等。 相較於黃仁勳宏大遠景的演講內容,蘇姿丰的演講具備工程師的務實與普及化精神。她強調的是,AI不應該是奢侈品,而是像電力一樣,無所不在且唾手可及。為了達到這個目的,超微CES展發表Instinct MI455X與Ryzen AI Max(Halo)兩大核心產品。Instinct MI455X是要建構無所不在的雲端與企業基礎設施,MI455X是超微目前最強大的AI晶片,主要解決AI的規模化與普及化問題,搭載高達432GB的HBM4記憶體,專為訓練和推論兆級參數的大型模型而設計,意味著雲端能提供更強大的AI服務給大眾使用。透過MI455X驅動Helios機架平台,超微宣告進入堯位元(Yottascale)運算時代,讓企業能低成本、高效率部署私有 AI設施,讓AI更普及化。 Ryzen AI Max(Halo)是將強大算力從雲端帶到終端用戶身邊的關鍵,它能讓筆記型電腦或小型桌機(SFF)能脫離雲端,直接在本地運行高達二千億參數的模型。這款產品打破了過往高效能AI必須連接伺服器的限制,讓開發者能在個人工作站上直接開發與測試,這也讓未來人形機器人、智慧醫療與車用電子等邊緣設備,將擁有不亞於資料中心的即時推論能力。打個比方來說,MI455X在雲端負責大腦的訓練,並產生強大的AI能力。Ryzen AI Max(Halo)在邊緣運算,負責肢體的執行,將AI能力落實到個人PC與嵌入式設備中。 蘇姿丰的演講內容,傳達的是算力在指尖的世界。未來人類自己的私密數據(醫療紀錄、財務狀況、情感日記)都不需要存在雲端,搭載Ryzen AI Max的終端電腦可以就近處理一切,讓邊緣運算徹底爆發,得以保障個人隱私。超微將推動開放生態(ROCm)平台,未來AI軟體不會被單一公司壟斷。全球開發者可以自由在超為平台上開發教育、藝術、科學工具,人類的知識傳播不再有障礙。
三大層面改變人類生活 CES展發表的Vera Rubin、Cosmos、MI455X與Ryzen AI Max一旦整合進我們社會後,對我們生活可能有三項改變:一、勞動力市場徹底重新建構,藍領勞動將大規模由具有智慧的機器人取代;第二、高階運算力讓VR/AR技術達到使人類生理視覺無法分辨的程度。遠端協作不再只是視訊會議,而是數位化降臨。超微的高速傳輸晶片讓數據延遲趨近於零,名醫可以在大都市替偏鄉患者進行遠端手術,將平衡城鄉據大的差距;第三、每個人都會擁有一個AI的隨身智慧核心,它儲存個人的知識與習慣。人類將具備第二個大腦,當你學習外語、量子物理時,AI會根據個人的認知模型提供最合適的教學路徑。 全球能夠生產AI晶片的廠商相當有限,Nvidia與超微生產的是通用型AI晶片、加速器。市占率方面,Nvidia有九成(或超過)的絕對優勢,從先前的H100、H200系列GPU和Blackwell機櫃,在全球AI晶片市場上占有絕對的優勢。超微AI晶片市占率還不到一成,但與OpenAI、微軟、Meta、甲骨文等大型客戶持續擴大合作,加上最新一代AI加速器已確認排定出貨。這是因為Nvidia的AI晶片無法全部吃下整個市場,還有晶片價格定位等的問題,大客戶不想全部押上Nvidia,這讓超微找到能生存的空間。 谷歌、亞馬遜、Meta和微軟等科技大廠都有自己IC設計部門,且已研發出屬於自己的客製化晶片ASIC,並用在自身資料中心內部,擔任不同的運算功能,以降低建置成本。谷歌的TPU原本只用在自家智慧雲端上不對外發售,去年下半年改變策略,Meta向谷歌採購TPU。不過,目前ASIC的AI晶片規模仍小,不論在用途與數量上,無法與Nvidia和超微的AI晶片相比擬。 …本文摘錄自 先探投資週刊 2026/1月 第2387期
閱讀完整內容



