低成本高性能美科技巨頭關注 Meta組戰情室應對

編譯葉亭均、記者謝守真／綜合報導

▲北京一名用戶的手機廿七日秀出中國大陸人工智慧新創公司DeepSeek畫面。（法新社）

中國大陸人工智慧（ＡＩ）新創公司DeepSeek（深度求索）以低成本推出高性能ＡＩ模型震撼矽谷，臉書母公司Meta的ＡＩ研究人員陷入恐慌。據傳Meta生成式ＡＩ團隊的主管和工程師已成立四個「戰情室」專門研究DeepSeek的運作方式。

DeepSeek掀起的大模型旋風愈演愈烈，DeepSeek昨天在蘋果App Store大陸區和美國區免費榜均站上冠軍位置，超越ChatGPT及Meta旗下Threads，以及谷歌Gemini、微軟Copilot等知名應用。然而，DeepSeek受到廣泛關注也引起美國科技巨頭的警覺，勢必會有因應舉措。

科技新聞網站The Information報導，Meta的ＡＩ團隊主管近日對DeepSeek推出的新模型公開表達擔憂，擔心Meta在ＡＩ競賽中落後。兩名員工透露，包括ＡＩ基礎設施總監歐德漢等主管擔心，自家旗艦ＡＩ模型Llama的新版本表現可能無法與DeepSeek匹敵。

DeepSeek去年底推出大型語言模型「DeepSeek V3」，根據多份美國公司發表的評估和使用者評價，這款模型在完成多種任務上，符合或甚至超越三大ＡＩ公司Meta、OpenAI和Anthropic的模型；該公司接著在本月廿日推出另一模型「DeepSeek-R1」，可能媲美OpenAI的o1推理模型。

應用程式（App）開發商能自由下載DeepSeek，或是透過基於雲端的應用程式介面購買使用權。一些規模較小的App開發商表示，他們已改用DeepSeek，原因是成本低。

The Information報導指出，OpenAI、Meta和其他頂尖開發商研究人員正仔細分析DeepSeek模型，以尋找可借鏡之處，包括它如何以更低成本、更具效率的方式運作。

Meta已為此籌組四個「戰情室」。一名員工透露，兩個小組聚焦於研究如何降低訓練和運作DeepSeek的成本。雖然Meta的模型是免費的，但是運作成本比OpenAI的模型更高，部分原因是OpenAI能夠透過批次處理消費者數百萬次的查詢來降低價格。第三個研究小組正在試圖釐清DeepSeek使用了哪些數據來訓練其模型；第四個戰情室則是考慮基於DeepSeek模型歸納出的特質，重新建構Meta的模型。

據稱，Meta正考慮推出一個類似DeepSeek的Llama版本，包含多個ＡＩ模型，每個模型專門訓練處理不同任務。

台積ＡＤＲ、輝達受重挫

編譯林奇賢／綜合外電

中國ＡＩ新創公司DeepSeek以高性價比推出能夠媲美OpenAI性能的ＡＩ模型，震驚矽谷與科技界，消息拖累台積電ＡＤＲ美股盤前摔百分之九點八、輝達重挫百分之十點三。

荷蘭晶片設備製造大廠艾司摩爾（ＡＳＭＬ）在阿姆斯特丹交易的股票，廿七日也一度大跌百分之十一至六二六點三歐元，為去年十月十五日以來最大盤中跌幅。偏重科技股的那斯達克100期貨指數也急挫。閱讀完整內容

本文摘錄自‎

聯合報 20250128

由聯合報提供

免費體驗書籍簡介

陸DeepSeek震撼AI界

本文摘錄自‎

聯合報 20250128

由聯合報提供

相關

本文摘錄自‎

聯合報 20250128

由 聯合報 提供

相關

相關文章

由聯合報提供