開源模式、降低成本效益 擺在世人眼前
雖然全球最頂級的AI晶片仍由Nvidia全面主宰,這次深度求索重擊美股,加上最近Nvidia股價弱勢,鼓舞開發商未來可能不需要砸大錢買高階AI晶片就能做出適合自己用的AI模型,會激勵AI ASIC晶片產業蓬勃發展。 文●魏聖峰 美國總統川普剛就任的隔天,馬上召集軟銀、甲骨文和OpenAI高層,將耗資五千萬美元在美國成立類似主權AI的相關投資計畫。不料,隔天原本沒有名氣的中國深度求索(DeepSeek)發表一款AI模型R1,之後引發華爾街市場大震撼,且被市場稱為「AI珍珠港事件」,襲擊美國AI相關股,並讓美股在一月二十七日當天市值蒸發掉一兆美元,與AI關聯度最高的費城半導體指數當天重挫後,因Nvidia表現不佳至今走勢相對弱勢,等於是給川普洗臉。 美國與中國關係惡化,從八年前川普在第一任總統期間宣布向中國發動貿易戰。拜登繼任總統後,除貿易戰外還擴大封鎖中國科技。對中國的科技封鎖不限美國企業,還把美國所有的盟友拉進來,持續要求外資企業撤離中國並選邊站。在這樣敵我界線分明下,中國透過各種管道還是有能力拿到Nvidia的高階AI晶片。深度求索承認使用約兩千多片的H200晶片,且整個開發成本僅約五六○萬美元就打造出能與OpenAI、谷歌同等級的AI模型DeepSeek-R1。這樣的AI模型成本結構與美國大型CSP業者至少要使用一.六萬片的H200和H100晶片相比,其開發成本僅是OpenAI成本的二%。在DeepSeek-R1大出鋒頭後,引發全球用戶大量下載,不到一個星期,累積的下載次數超過一六○○萬次,尤其以印度用戶的下載數量最高。
華爾街質疑開發成本過低 衝擊過後,華爾街引述數名半導體分析師對深度求索能以如此低成本,打造出能與美國先進AI模型相匹敵產品提出質疑,大部分分析師普遍認為深度求索不太可能以這麼低的成本打造出具突破性的AI模型,要不然那些美國大型CSP業者過去不就白花錢。OpenAI創辦人阿特曼(Sam Altman)也跳出來質疑,深度求索有不合法使用OpenAI模型的技術,而他們也掌握相關的證據。部分晶片分析師認為,深度求索應該用到五萬片的AI晶片才做得出來,而五六○萬的開發成本也僅能算是應用上的使用成本。因為五萬片AI晶片的成本就不只這些金額,也有分析師質疑應該有中國政府介入,才有辦法做得出來。 Meta目前正在研發的Research Super Cluster(RSC)至少就使用超過一.六萬片的A100晶片,該公司目前的Llama大型語言模型、谷歌Gemini和OpenAI的AI模型也都耗掉上萬片的AI晶片才做得出來。特斯拉創辦人馬斯克的xAI早已購入超過十萬片的H200和H100晶片,只要Nvidia的GB200晶片出得了貨,也都會被特斯拉、甲骨文和大型CSP業者掃貨。市場擔心如果深度求索能以極低的成本打造出AI模型,就會引來AI產業反思是否真的有必要砸大錢打造AI模型,甚至引發AI產業是否將泡沫化的問題。
遭美國封鎖下生出的產品 以時間推論,不論是深度求索在去年十二月下旬推出的DeepSeek-V3還是這次令市場震撼的DeepSeek-R1 AI模型,在開發期間都處於被美國政府科技封鎖期間。雖然Nvidia推出閹割版的H20晶片,只有H200本尊效能的十分之一,他們還是能開發出頂尖的AI模型出來。先進的AI系統需歸納文字、圖片、影音等大數據的深度學習技能,深度求索大概是把這些數據分析工作分配給多個不同模型,每個模型負責特定領域,力求讓高效數據處理的時間縮短。這種方式在美國和其他發展AI模型的國家並非沒做過,只不過是沒辦法像深度求索那樣僅用到更少的運算能力就做到這樣的地步。 不過,質疑歸質疑,美國要想作為AI霸主甚至是未來AI產業規則的制定者,就要有能力提升實力,讓其他競爭對手(尤其是中國、俄羅斯、北韓和伊朗)趕不上來。OpenAI很快地就對外釋出o3-mini的輕量級推理模型,而且提供任何人免費下載和使用。美國業者開發的AI模型都被視為是商業機密,幾乎都屬於閉源系統(closed source),用戶僅能在AI業者提供的模型平台下付費使用,AI業者的確也提供用戶部分免費下載使用和問題諮詢,但是有限量的。只要輸入/輸出超過限額就要付費。不過。深度求索的AI模型都是開源系統(open source),並歡迎開發商免費使用其平台。開源系統的模式有好處就是能讓更多的用戶使用其AI模型,然後再激發出更多不同類型的AI模型,有利於AI領域蓬勃發展。對整體AI領域發展,開源模式的確比閉源模式好,卻也可能造成AI模型開發者的成本進一步墊高,且可能影響其收入來源。
開源模式打亂AI生態 中國的言論審查嚴格,卻讓AI模型以開源模式發展。深度求索的AI模型都向全世界的用戶開放,透過開源模式能讓深度求索取得更多外國的大數據資料以及用戶資訊,加上美國AI業者大多採閉源模式,僅Meta的Llama 3.1採開源模式,有可能會讓更多用戶湧向中國的AI模型,進一步加速讓中國建構AI生態圈,未來是否會衍生出類似現在全球用戶高度依賴TikTok情況,不無可能,這或許是中國的考量情境之一。面對這個問題,很多西方國家都限制政府部門雇員禁止使用深度求索的AI模型,未來也可能會祭出更嚴格的科技封鎖中國在AI模型的發展,最近市場傳出連Nvidia的H20晶片也列入管制範圍內。 若比較應用場景,如果是初級的AI使用者,DeepSeek-R1的推理範圍和數理使用領域應該就夠用,這個AI模型適合教育和基礎研究者使用,但其安全性比較低。不過,深度求索同樣受到中國政府的言論審查,敏感性的政治議題就會問不到,這是一般人使用上的困擾。排除這類問題,DeepSeek-R1應該還算很好用。o3-mini的應用場景比DeepSeek-R1適合更專業、技術密集者使用,這應該屬於專業型的商用客戶以及部分學術研究機構,其安全性會比DeepSeek-R1高。
深度求索的AI模型一炮而紅,鼓舞其他國家的AI開發者盡可能地找出降低AI訓練成本的方法。這會讓市場對AI ASIC晶片需求更大,博通、MarvellTechnology是兩大ASIC晶片的IC設計業者。他們擁有龐大的IP,很多AI開發商買不起Nvidia和超微的高階AI晶片,為了降低開發成本就會尋求ASIC晶片業者委託設計,世芯KY(3661)、創意(3443)、M31(6643)、智原(3035)、聯發科(2454)和晶心科(6533)等IP業者同步受惠未來的商機。即便如此,只要用到五奈米以下的先進製程,在晶圓代工這塊也只有台積電才能滿足客戶,暫時不會影響到台積電先進製程的訂單。從最近Nvidia的股價表現來看,受到深度求索事件衝擊,呈現弱勢,台積電ADR、博通和Marvell Technology的股價走勢則比較有抗跌力道,而台股相關的IP股經過一天震撼教育後,股價都有展現反彈能力,凸顯市場對未來ASIC晶片看好度增加中。
閱讀完整內容本文摘錄自
deepseek改寫AI版圖
先探投資週刊
2025/2月 第2338期
相關