-
DeepSeek創(chuàng)始人,一個(gè)“技術(shù)理想主義者”
最后更新: 2025-01-30 12:47:27【文/觀察者網(wǎng) 陳思佳】近期,中國(guó)人工智能公司深度求索(DeepSeek)發(fā)布的DeepSeek-R1模型轟動(dòng)全球,使用極低的成本實(shí)現(xiàn)了匹敵美國(guó)頂級(jí)AI模型的效果,得到從業(yè)者的廣泛稱(chēng)贊。許多研究人員、投資者和西方媒體感嘆,中國(guó)AI模型令硅谷震驚,甚至可能改變大模型的研發(fā)規(guī)則。
隨著DeepSeek爆火,其創(chuàng)始人梁文鋒也受到公眾關(guān)注。作為一位17歲考入浙江大學(xué)、在量化投資和AI領(lǐng)域均取得驚人成就的“學(xué)霸”,梁文鋒卻始終保持低調(diào),很少拋頭露面。許多人好奇,這位低調(diào)的85后創(chuàng)業(yè)者究竟是如何取得成功。
用數(shù)學(xué)和AI進(jìn)行量化投資
公開(kāi)資料顯示,梁文鋒1985年出生于廣東省湛江市。2002年,17歲的梁文鋒考入浙江大學(xué)電子信息工程專(zhuān)業(yè),并在2010年獲得信息與通信工程碩士學(xué)位。
在校期間,他對(duì)金融市場(chǎng)產(chǎn)生了濃厚興趣。特別是在2008年全球金融危機(jī)爆發(fā)后,他曾帶領(lǐng)團(tuán)隊(duì)使用機(jī)器學(xué)習(xí)技術(shù)分析市場(chǎng)數(shù)據(jù),嘗試實(shí)現(xiàn)全自動(dòng)量化交易。這一經(jīng)歷為梁文鋒積累了實(shí)踐經(jīng)驗(yàn),也為他日后的職業(yè)生涯奠定了堅(jiān)實(shí)的基礎(chǔ)。
DeepSeek創(chuàng)始人梁文鋒
畢業(yè)后,梁文鋒首先進(jìn)入了金融領(lǐng)域。2013年,他與浙大同學(xué)徐進(jìn)共同創(chuàng)立了杭州雅克比投資管理有限公司,并在2015年成立了杭州幻方科技有限公司,致力于通過(guò)數(shù)學(xué)和AI進(jìn)行量化投資。
2016年,幻方量化推出首個(gè)基于深度學(xué)習(xí)的交易模型,并開(kāi)始將GPU引入計(jì)算交易倉(cāng)位。在此之后,梁文鋒不斷擴(kuò)大AI算法研究團(tuán)隊(duì),將AI技術(shù)深度融入量化策略,逐步取代傳統(tǒng)模型。2017年,幻方宣稱(chēng)實(shí)現(xiàn)投資策略全面AI化。2018年,幻方正式確立以AI為核心的發(fā)展戰(zhàn)略。
但隨著業(yè)務(wù)的快速擴(kuò)展,計(jì)算資源不足的問(wèn)題逐漸顯現(xiàn)。2019年,梁文鋒帶領(lǐng)團(tuán)隊(duì)自主研發(fā)了“螢火一號(hào)”訓(xùn)練平臺(tái)。2020年開(kāi)始,總投資近2億元、搭載了1100張GPU的“螢火一號(hào)”正式投入運(yùn)作。2021年,幻方投入10億元建設(shè)“螢火二號(hào)”。
幻方量化在2018年首次獲得私募金牛獎(jiǎng),這是中國(guó)私募證券領(lǐng)域的最高獎(jiǎng)項(xiàng)。2019年,梁文鋒在當(dāng)年的金牛獎(jiǎng)?lì)C獎(jiǎng)儀式上發(fā)表了主題演講《一名程序員眼里中國(guó)量化投資的未來(lái)》,這是他少有的公開(kāi)發(fā)言。
當(dāng)時(shí),梁文鋒在演講中表示,“量化投資的未來(lái),是用技術(shù)讓市場(chǎng)更有效率”。
在AI領(lǐng)域一鳴驚人
2023年,梁文鋒宣布正式進(jìn)軍通用人工智能(AGI)領(lǐng)域,創(chuàng)辦了深度求索(DeepSeek)。據(jù)報(bào)道,DeepSeek包括創(chuàng)始人梁文鋒在內(nèi),僅有139名工程師和研究人員。相比之下,開(kāi)發(fā)ChatGPT的OpenAI有1200名研究人員,開(kāi)發(fā)Claude模型的Anthropic則有500多名研究人員。
雖然團(tuán)隊(duì)規(guī)模不大,DeepSeek在此后一年多里取得了令人矚目的成果。2024年5月,DeepSeek發(fā)布DeepSeek-V2模型,憑借創(chuàng)新的模型架構(gòu)和性?xún)r(jià)比引發(fā)關(guān)注。DeepSeek-V2的API定價(jià)為每百萬(wàn)tokens輸入1元、輸出2元,價(jià)格僅為美國(guó)OpenAI GPT-4 Turbo的百分之一。
DeepSeek解釋稱(chēng),DeepSeek-V2采用了創(chuàng)新的架構(gòu),例如注意力機(jī)制方面的MLA(多頭潛在注意力)和前饋網(wǎng)絡(luò)方面的DeepSeekMoE架構(gòu)等,以實(shí)現(xiàn)具有更高經(jīng)濟(jì)性的訓(xùn)練效果和更高效的推理。
據(jù)澎湃新聞報(bào)道,DeepSeek-V2的出現(xiàn)一度引發(fā)國(guó)內(nèi)的大模型“價(jià)格戰(zhàn)”,百度、阿里、字節(jié)跳動(dòng)等大廠紛紛宣布大模型產(chǎn)品降價(jià)。對(duì)此,梁文鋒在接受媒體采訪時(shí)表示,DeepSeek無(wú)意成為行業(yè)鲇魚(yú),低價(jià)背后是希望算力普惠。
去年12月26日,DeepSeek-V3模型發(fā)布,引發(fā)科技行業(yè)高度關(guān)注。DeepSeek網(wǎng)站發(fā)布的信息顯示,DeepSeek-V3多項(xiàng)評(píng)測(cè)成績(jī)超越了Qwen2.5-72B和Llama-3.1-405B等其他開(kāi)源模型,甚至可以與GPT-4o、Claude 3.5-Sonnet等頂級(jí)閉源模型一較高下。
更引人注目的是,DeepSeek-V3使用的成本和算力極低,僅使用2048顆算力稍弱的英偉達(dá)H800 GPU,成本約為557.6萬(wàn)美元。相比之下,OpenAI的GPT-4o訓(xùn)練成本高達(dá)7800萬(wàn)美元。這意味著,DeepSeek-V3以十分之一的成本實(shí)現(xiàn)了足以與GPT-4o較量的水平。
今年1月20日,DeepSeek進(jìn)一步取得突破,正式發(fā)布DeepSeek-R1模型。該模型在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,性能比肩OpenAI o1正式版。該模型在后訓(xùn)練階段大規(guī)模使用強(qiáng)化學(xué)習(xí)(RL)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。
DeepSeek-R1、OpenAI-o1-1217和DeepSeek-V3的性能比較 DeepSeek微信公眾號(hào)
這一系列成就震動(dòng)全球科技行業(yè)。美國(guó)OpenAI創(chuàng)始成員之一安德烈·卡帕西(Andrej Karpathy)在社交媒體上稱(chēng)贊:“DeepSeek在有限資源下展現(xiàn)了驚人的工程能力,它可能重新定義大模型研發(fā)的規(guī)則?!?
硅谷知名風(fēng)險(xiǎn)投資家馬克·安德森(Marc Andreessen)將DeepSeek-R1的發(fā)布與美國(guó)總統(tǒng)特朗普入主白宮相提并論,他稱(chēng)贊這是“最令人驚嘆的突破之一,給世界的一份意義深遠(yuǎn)的禮物”。
DeepSeek的成功與梁文鋒在團(tuán)隊(duì)管理和技術(shù)研發(fā)上的獨(dú)特策略有著密切的關(guān)系。他組建了一支由本土年輕程序員組成的團(tuán)隊(duì),不依賴(lài)海歸或高級(jí)技術(shù)專(zhuān)家,團(tuán)隊(duì)成員多為應(yīng)屆畢業(yè)生或工作經(jīng)驗(yàn)不超過(guò)5年的年輕人。
梁文鋒曾向媒體坦言,團(tuán)隊(duì)“并沒(méi)有什么高深莫測(cè)的奇才,都是一些Top高校的應(yīng)屆畢業(yè)生、沒(méi)畢業(yè)的博四、博五實(shí)習(xí)生,還有一些畢業(yè)才幾年的年輕人”。他認(rèn)為,“創(chuàng)新需要擺脫慣性,經(jīng)驗(yàn)有時(shí)會(huì)成為包袱。”
低調(diào)的“技術(shù)理想主義者”
從應(yīng)用AI進(jìn)行量化投資,到投身AI大模型研發(fā),驅(qū)動(dòng)梁文鋒的卻并不是來(lái)自商業(yè)方面的理由。他在有限的幾次媒體采訪中坦言:“幻方的主要班底里,很多人是做人工智能的。當(dāng)時(shí)我們嘗試了很多場(chǎng)景,最終切入了足夠復(fù)雜的金融,而通用人工智能可能是下一個(gè)最難的事之一,所以對(duì)我們來(lái)說(shuō),這是一個(gè)怎么做的問(wèn)題,而不是為什么做的問(wèn)題……如果一定要找一個(gè)商業(yè)上的理由,它可能是找不到的,因?yàn)閯澆粊?lái)?!?
他表示,“很多人會(huì)以為這里邊有一個(gè)不為人知的商業(yè)邏輯,但其實(shí),主要是好奇心驅(qū)動(dòng)……對(duì)AI能力邊界的好奇?!?
DeepSeek一直堅(jiān)持開(kāi)源路線(xiàn),主動(dòng)向全球開(kāi)發(fā)者分享了核心技術(shù)成果。在一些業(yè)內(nèi)人士看來(lái),梁文鋒其實(shí)是一位低調(diào)的“技術(shù)理想主義者”。
去年,梁文鋒在接受媒體采訪時(shí)表示,在顛覆性的技術(shù)面前,閉源形成的護(hù)城河是短暫的。即使OpenAI閉源,也無(wú)法阻止被別人趕超。“開(kāi)源更像一個(gè)文化行為,而非商業(yè)行為。給予其實(shí)是一種額外的榮譽(yù)。一個(gè)公司這么做也會(huì)有文化的吸引力。”
梁文鋒認(rèn)為,隨著經(jīng)濟(jì)發(fā)展,中國(guó)也要成為貢獻(xiàn)者:“我們已經(jīng)習(xí)慣摩爾定律從天而降,躺在家里18個(gè)月就會(huì)出來(lái)更好的硬件和軟件。Scaling Law(縮放定律)也在被如此對(duì)待。但其實(shí),這是西方主導(dǎo)的技術(shù)社區(qū)一代代孜孜不倦創(chuàng)造出來(lái)的,只因?yàn)橹拔覀儧](méi)有參與這個(gè)過(guò)程,以至于忽視了它的存在。”
他當(dāng)時(shí)還表示,中國(guó)AI不可能永遠(yuǎn)處在跟隨的位置,“很多國(guó)產(chǎn)芯片發(fā)展不起來(lái),也是因?yàn)槿狈ε涮椎募夹g(shù)社區(qū),只有第二手消息,所以中國(guó)必然需要有人站到技術(shù)的前沿?!?
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
標(biāo)簽 人工智能- 責(zé)任編輯: 陳思佳 
-
一客機(jī)與美軍“黑鷹”直升機(jī)相撞后墜入河中,特朗普回應(yīng)
2025-01-30 12:44 美國(guó)一夢(mèng) -
谷歌擅自改名,墨西哥:會(huì)要個(gè)說(shuō)法
2025-01-30 11:44 -
DeepSeek在意大利無(wú)法下載
2025-01-30 11:12 -
美國(guó)向?yàn)蹩颂m移交90枚早前提供給以色列的愛(ài)國(guó)者導(dǎo)彈
2025-01-30 10:14 烏克蘭之殤 -
急了!特朗普考慮,英偉達(dá)特供版也不賣(mài)中國(guó)
2025-01-30 09:55 -
美準(zhǔn)商務(wù)部長(zhǎng)揚(yáng)言:要對(duì)中國(guó)征最高水平關(guān)稅
2025-01-30 09:34 中美關(guān)系 -
他出任敘利亞過(guò)渡階段總統(tǒng)
2025-01-30 07:27 -
美聯(lián)儲(chǔ)維持利率不變,但表述有變化
2025-01-30 07:27 觀網(wǎng)財(cái)經(jīng)-海外 -
美國(guó)一工會(huì)起訴,阻止白宮“裁員”
2025-01-30 07:26 美國(guó)政治 -
特朗普簽署首項(xiàng)法案
2025-01-30 07:11 特朗普 -
-
又一位安保被撤,“軍銜或?qū)⒉槐!?/a>
2025-01-29 23:06 美國(guó)政治 -
印度開(kāi)始焦慮:為啥中國(guó)行,我們不行?
2025-01-29 22:30 龍象之間 -
“美國(guó)政府面臨巨大挑戰(zhàn),整個(gè)戰(zhàn)略被證明無(wú)效”
2025-01-29 20:16 中美關(guān)系 -
2名中國(guó)公民在南蘇丹墜機(jī)事故中死亡
2025-01-29 19:03 航空安全 -
柬埔寨運(yùn)河項(xiàng)目黃了?中柬關(guān)系完了?我駐柬使館發(fā)文
2025-01-29 17:27 中國(guó)外交 -
美國(guó)“TikTok難民”被一道中國(guó)菜征服了
2025-01-29 16:54 中美關(guān)系 -
生效前幾分鐘,特朗普這項(xiàng)行政令被法官叫停
2025-01-29 16:27 美國(guó)一夢(mèng) -
白宮“裁員”:2月6日前辭職可領(lǐng)工資到9月底
2025-01-29 15:29 美國(guó)政治 -
扎哈羅娃用中文拜年:祝大家“蛇么”都好,“蛇么”都如意
2025-01-29 13:58
相關(guān)推薦 -
“2027年起,整個(gè)產(chǎn)業(yè)將拱手讓給中國(guó)” 評(píng)論 56“不如申請(qǐng)成中國(guó)一省” ,德國(guó)鋰企竟如此激將歐盟 評(píng)論 90美兩員“大將”施壓未果,日本反倒成了“難啃的骨頭” 評(píng)論 91美國(guó)放風(fēng):伊朗有動(dòng)作了 評(píng)論 90靠萬(wàn)斯“決勝一票”,“大而美”法案驚險(xiǎn)闖關(guān)參議院 評(píng)論 184最新聞 Hot
-
美方撤銷(xiāo)對(duì)華乙烷出口限制
-
特朗普參觀“鱷魚(yú)惡魔島”:拜登就想把我關(guān)在這兒,這XX養(yǎng)的
-
公安部通報(bào):陳某為吸粉引流編造“工行假金條”,已被依法追責(zé)
-
“2027年起,整個(gè)產(chǎn)業(yè)將拱手讓給中國(guó)”
-
特朗普威脅:敢礙事,就逮捕你
-
“7年前就發(fā)現(xiàn)問(wèn)題了,一直沒(méi)修”
-
“不如申請(qǐng)成中國(guó)一省” ,德國(guó)鋰企竟如此激將歐盟
-
終于換了,特朗普:我很滿(mǎn)意
-
要跟中國(guó)對(duì)著干?“剛果(金),別斷送發(fā)展機(jī)遇”
-
美兩員“大將”施壓未果,日本反倒成了“難啃的骨頭”
-
白宮找補(bǔ):美國(guó)很強(qiáng),不信去問(wèn)伊朗
-
何君堯:建議給皇后大道、維多利亞公園改名
-
“美國(guó)自毀長(zhǎng)城,中企憑高性?xún)r(jià)比一路高歌猛進(jìn)”
-
兩國(guó)矛盾激化,阿媒突然發(fā)文:收到匿名材料,是俄軍擊中的
-
裝不裝空調(diào),法國(guó)政客都能吵起來(lái)
-
潛入醫(yī)院裝電詐設(shè)備,騙走30萬(wàn)!今年已發(fā)生多起
-