何方神聖〉廣東小城高考狀元意外造出中國AI界鯰魚

過去一周，一款由中國AI新創深度求索所推出的大型語言模型DeepSeek-R1，在全球資本市場颳起一陣旋風，也讓矽谷科技巨擘為之瘋狂。究竟，這家成立不到兩年的新創公司有何本事？它的創辦人又是何方神聖？

撰文‧黃煒軒

▲視覺中國

Profile 梁文鋒
出生：1985年
現職：深度求索創辦人、幻方量化聯合創辦人
經歷：杭州雅克比投資管理有限公司共同創辦人、杭州幻方科技創辦人
學歷：中國浙江大學信息與通信工程專業碩士

「我們不是故意要成為一條鯰魚，只是，不小心成了一條鯰魚⋯⋯。」這是中國AI新創公司深度求索（DeepSeek）創辦人梁文鋒，在去年中接受中國媒體採訪時的一段談話。

DeepSeek，梁文鋒；一家公司，一號人名，也是過去一周間，全球資本市場最火熱的兩個關鍵詞。

時序，先回到去年六月。

當時，DeepSeek發布了一款名叫DeepSeek-V2的大型語言模型，因其在特定推理任務上展現的優異性能，引起了中國科技圈的廣泛關注；此外，V2相較國際指標語言模型更為低廉的訓練與開發成本，也在字節跳動、阿里巴巴、百度、騰訊等中國一線AI科技大廠之間，掀起了一場意料之外的「價格戰」，被外界形容為是中國AI界的「鯰魚效應」。

篤信AI終將改變世界
攻讀碩士期間探索「全自動量化交易」

然而，半年過去，就在中國科技大廠仍心有餘悸之際，這條鯰魚，在最新一代DeepSeek-R1模型的「助攻」下，無預警地，游到了太平洋的另一端，震撼了矽谷科技巨擘，嚇壞了華爾街與歐美政壇。

一時之間，全世界都在問，DeepSeek是何方神聖？梁文鋒又是誰？而DeepSeek背後的「金主」幻方量化，又是一家什麼樣的機構？

答案，得先從廣東西南部的一座小城——湛江說起。

矽谷人稱「來自東方神祕力量」的梁文鋒，一九八五年出生於廣東湛江吳川巿的一個小村落——米歷嶺村。據家鄉人的說法，梁文鋒自小就精通數理，初中時期就學完了高中數學，甚至開始自學大學的微積分等課程。

二○○二年，梁文鋒以吳川一中「高考狀元」的成績，考上近年直追清華、北大，中國國內綜合排名長期位居前五的浙江大學，並在○六年及一○年，分別取得電子資訊工程和計算機科學的學士和碩士學位。

在攻讀碩士、專研機器學習的期間，梁文鋒開始對AI的發展和潛力應用產生興趣，並篤信「人工智慧終將改變世界」。

信念，很快地轉化為行動。

正當美國次貸風暴席捲全球的○八年，還在攻讀碩士的梁文鋒，與幾個志同道合的同校友人，開始嘗試運用機器學習技術，收集金融市場即時行情與總體經濟等相關數據，探索「全自動量化交易」的可能性。這成為他日後成立對沖基金「幻方量化」的基礎。

量化策略全採AI模型計算
成立不滿三年資產管理規模破億人民幣

一三年起，梁文鋒與同是浙大畢業、待過華為上海研究所的校友徐進，以及另一校友、曾任盛大網絡旗下創新研究院的鄭達韡開始合夥創業，陸續成立投資公司、資產管理公司，其中，一六年成立的寧波幻方量化最廣為人知，而包含寧波幻方、浙江九章資產等多家「幻方系」企業，梁文鋒皆持股過半，為最終的實際控制人。

幻方量化的擴張速度非常快。一六年，幻方量化第一個由AI模型產生的股票實盤交易上線，使用GPU（繪圖處理器）進行運算。截至一七年底，該公司幾乎所有的量化策略，都已採用AI模型計算。

只用不到三年時間，幻方量化的資產管理規模就突破百億人民幣（以下單位同），躋身中國量化私募領域的「四天王」之列。二一年，一舉突破千億元大關，登上四天王之首。成立至今，幻方量化已連續多年拿下中國私募證券領域的最高獎項「金牛獎」。

一路猛爆性的成長，相當程度反映在幻方的「成績單」上。以幻方旗下旗艦產品、一八年成立的「量化對沖X號」為例，其截至二四年三月的平均年化報酬率，達到二八．五％，為同期滬深三百指數的兩倍以上。在巔峰的二一年，幻方旗下產品的年化報酬率更是高達三五％。

外界普遍認為如此不俗的成績，來自於幻方背後強大的「算力」。

其實，從幻方量化成立的第一年起，梁文鋒就意識到幻方迫切需要更多的算力，一九年時便由幻方轉投資一家AI基礎研究公司，投入兩億元自主研發深度學習的訓練平台「螢火一號」。據稱，平台搭載了一一○○塊的GPU顯卡。

約當同時，梁文鋒開始大量囤積來自輝達的顯卡。在梁文峰參與的一篇技術論文裡寫道，幻方於二一年耗資十億元推出的改良版「螢火二號」，就部署了多達一萬張的輝達A100顯卡。而據中國業內人士估算，幻方的螢火超算平台，算力至少是同業平均的十倍以上，每秒可處理高達數百萬條的市場資訊。

積極探索「算力的可能性」

進軍AGI 高「性價比」模型投震撼彈

就在梁文鋒熱中於打造營火平台時，幻方在量化投資績效也趨於平緩，以綜合平均報酬和中位數的報酬率來看，在中國私募排行榜中，去年幻方的績效排在第十九位，前一年更僅排在第三十二位，雖不算太差，但顯然不及幾年前的光彩。

恰好此時，ChatGPT橫空問世，讓原本就對「算力的可能性」充滿各種探索渴望與想像的梁文鋒，發現下一個值得追求的目標：通用人工智慧（AGI）。二三年五月，三十八歲的梁文鋒宣布進軍AGI；兩個月後，DeepSeek正式成立。

一開始，DeepSeek推出的DeepSeek Coder（免費且開源的首個模型）、DeepSeek LLM（第一個大語言模型），都未引起太多關注。直到去年五月，DeepSeek發布DeepSeekV2的開源模型後，中國AI大廠的警報聲，才開始響起。

V2模型在中國AI界掀起波瀾，除了是因性能優異，但更根本的關鍵，在於由DeepSeek公告的V2「性價比」，可謂「史無前例」。

根據官方數據，V2的推理成本每百萬詞元（token）僅需一元人民幣，換算下來，這只是Meta的LLaMA 3 70B模型成本的七分之一，更僅有GPT-4 Turbo的七十分之一。

等到去年底發表的DeepSeek-V3，該模型的效能不僅足以對標OpenAI最先進模型GPT-4o，訓練成本更僅約五五七．六萬美元； GPT-4o模型的訓練成本至少需要一億美元，DeepSeek僅用了約二十分之一的算力資源，就達到了相同的效能。

今年一月，DeepSeek-R1模型的發布，更宛如在AI界投下一枚深水炸彈，知名美國數據標記新創Scale AI創辦人汪滔（Alexandr Wang）感嘆，過去十年來，美國一直在人工智慧競賽中領先中國，「但DeepSeek的AI大模型，很可能會改變這一切。」

這家成立僅一年多的AI新創公司，為何能如此讓全球科技巨擘都為之震顫？

答案，或可從梁文鋒獨特的管理與用人哲學，窺探出一絲端倪。

首先，是在招募上的特定堅持。

「我們的核心技術職位，基本上以應屆和畢業一兩年的人為主。」梁文鋒曾表示，在招募人員上，他首重的是能力，至於經驗，反而是「扣分項」。

根據公開數據，DeepSeek目前約一四○位的工程師團隊，幾乎清一色都是應屆畢業生或博士在讀生，且多數來自清華、北大、北郵、北航等以電腦專業聞名的一線中國頂尖大學。「工作經驗在三到五年，已經是最多了，工作超過八年的，基本就pass了。」一名親近Deepseek的獵頭如此觀察。

對此，梁文鋒曾解釋：經驗不是不好，但對創新來說，過多的經驗往往是種「阻礙」。

他舉例，做一件事，有經驗的人，常常會不假思索告訴你，應該這樣做，「但沒有經驗的人，則會反覆摸索、很認真去想應該怎麼做。」他觀察，最終新人的解方，往往更有「突破性」。

不僅如此，招募新人時，DeepSeek還非常看重他們在國際知名程式設計競賽的表現，「基本是『金獎』以下就不要了。」一名協力廠商指出。

▲1月20日，中國國務院總理李強召開專家座談會，與會的DeepSeek創辦人梁文鋒，是在場唯一來自AI界的企業領袖。取自央視網

主張「不干預」
全面授權、無為管理方式成創新泉源

梁文鋒自然也提供比中國一線科技大廠更優渥的薪資待遇，來吸引年輕人，但他授權、無為的管理方式，更是留才的關鍵。

「每個人都有自己獨特的成長經歷，都是自帶想法的，不需要push他⋯⋯，當一個idea顯示出潛力，我們也會自上而下地去調配資源。」梁文鋒曾在訪談中如此形容他的「不干預」哲學。

梁文鋒自己就曾在訪談中透露，讓DeepSeek模型訓練成本大降的重中之重：「多頭潛在注意力架構（MLA）」，最初就是來自一個年輕研究員的個人興趣，「我們為此組了一個team，花了幾個月的時間才跑通。」

最終，推動DeepSeek快速前進的動力，則是來自梁文鋒個人長年對基礎研究的熱愛，以及對「開源」理念的堅定信仰。

談及梁文鋒，不少員工對他的形容是，與其說他像個老闆，不如說他更像個「極客」（geek）。梁文鋒的日常，就是看論文、寫代碼、參與小組討論，是少有具備一線研究員能力的公司掌舵者。

親力親為的投入，來自於他對中國的AI發展，始終懷抱著某種願景和理想。梁文鋒曾表示，長遠來說，DeepSeek希望形成一個開源的生態系，讓業界可以直接使用他們的技術，去發展To B和To C的業務，而DeepSeek，就只專注負責基礎模型的開發和前沿的創新。

他曾感嘆，中國AI和美國的真正差距，是來自「原創和模仿」的差距。「如果這不改變，中國永遠只能是追隨者。」

但，梁文鋒樂觀認為，隨著中國經濟下行，資本進入冷週期，整個社會和產業，對發展AI基礎這樣的「硬派創新」，將愈來愈重視，「因為錢不好賺了，（現在許多人）連開計程車的機會可能都沒了。」他觀察，當多數人發現，過去賺快錢很可能來自「時代運氣」，就會更願意俯身去做「真正的創新」。

如今，DeepSeek火爆全球，微軟、輝達、亞馬遜等一線美國科技大廠，乃至中國的百度、阿里巴巴等，紛紛高調宣告擁抱DeepSeek R1 的服務之際，梁文鋒孜孜矻矻追求的「硬派創新」夢想，或許，已在實現的道路上。閱讀完整內容

揭密深度求索DeepSeek創辦人梁文鋒

何方神聖〉廣東小城高考狀元意外造出中國AI界鯰魚

本文摘錄自‎