-
潘攻愚:從四個(gè)角度全面駁斥美方對(duì)DeepSeek的質(zhì)疑和污蔑
二、DeepSeek隱藏了總成本(TCO)參數(shù)?
Semianalysis和Anthropic對(duì)DeepSeek總成本的推斷,還涉及到除了GPU采購(gòu)之外的因素,諸如優(yōu)化架構(gòu)、處理數(shù)據(jù)、支付員工薪資等等,而這恰恰是我們最不太需要花費(fèi)心思去反駁的。
通常意義上,H100的云租賃成本不包括電力成本,在數(shù)據(jù)中心實(shí)際托管的IT設(shè)備的成本與占地面積、園區(qū)環(huán)境和政策支持密切相關(guān)。
從未到中國(guó)進(jìn)行過(guò)實(shí)地調(diào)研的Semianalysis,依據(jù)美國(guó)行情判斷DeepSeek的API服務(wù)成本也是欠妥當(dāng)?shù)摹?
美國(guó)本土的云服務(wù)和大模型部署合作也相當(dāng)復(fù)雜。與OpenAI自己的API相比,更多客戶(hù)選擇了微軟進(jìn)行公共和私有實(shí)例的推理,微軟當(dāng)年非常聰明地用自己的云服務(wù)積分置換對(duì)OpenAI的“天使輪投資”;而亞馬遜喜歡把他們的SageMaker平臺(tái)說(shuō)成是客戶(hù)在云上創(chuàng)建、訓(xùn)練和部署模型的好工具,但自己卻用英偉達(dá)的Nemo云原生框架代替Sagemaker,來(lái)開(kāi)發(fā)他們的模型。
相比Semianalysis對(duì)DeepSeek R1模型通過(guò)MLA(Multi-head Latent Attention)優(yōu)化KV Cache機(jī)制的分析,他們對(duì)DeepSeek托管、運(yùn)維和員工薪資的分析更像是一種臆測(cè)。
三、DeepSeek贏在了營(yíng)銷(xiāo)?
相比缺乏扎實(shí)一手調(diào)研和推論依據(jù)的成本估算,更讓人匪夷所思的是,無(wú)論是Semianalysis還是Dario Amodei都用了不少的篇幅闡述了DeepSeek的“營(yíng)銷(xiāo)”手段,包括但不限于R1模型在實(shí)戰(zhàn)中會(huì)首先向用戶(hù)展示推理的思路框架,以及DeepSeek R1故意把發(fā)布時(shí)間踩點(diǎn)特朗普就職典禮等等。Semianalysis總裁Dylan Patel在近日的視頻節(jié)目中,更是指出DeepSeek的營(yíng)銷(xiāo)勝在一個(gè)“快”上,比如說(shuō)半年多以前急于推出成熟度欠奉的V2模型,意在炒作。
無(wú)利不起早的海外大廠已經(jīng)用實(shí)際行動(dòng)反擊了這種“營(yíng)銷(xiāo)”說(shuō):從1月25日到2月1日,AMD的MI300X GPU、英偉達(dá)NIM微服務(wù)、英特爾Gaudi 2D Al加速器,均紛紛表示支持和接入DeepSeek V3/RI/Janus模型。如果DeepSeek沒(méi)有展示出足夠的技術(shù)實(shí)力,這些大廠為何要配合DeepSeek“營(yíng)銷(xiāo)”呢?
Semianalysis可能忽視了一個(gè)事實(shí):2022年年底OpenAI急于推出的ChatGPT就是走了先占坑位然后再調(diào)試的路線(xiàn),谷歌的Bard(現(xiàn)在已經(jīng)改名Gemini)晚了一步被OpenAI搶了先手,就在于其創(chuàng)始團(tuán)隊(duì)擔(dān)憂(yōu)這種聊天機(jī)器人會(huì)搶奪搜索引擎市場(chǎng)從而影響谷歌營(yíng)收,畢竟對(duì)谷歌來(lái)說(shuō),依靠搜索引擎導(dǎo)入的廣告收入占了大頭。
這一次,OpenAI在壓力之下推出了全新的免費(fèi)o3-mini(有趣的是,o3也在模仿R1展示推理思維鏈),可見(jiàn)“創(chuàng)新者困境”的魔咒和營(yíng)銷(xiāo)無(wú)關(guān),這是一種涌浪式的推陳出新競(jìng)爭(zhēng)法,指責(zé)DeepSeek以快取勝是毫無(wú)道理的。
從另一個(gè)層面上看,為什么OpenAI以及Anthropic的同推理模型不展示具體的推理思路呢?展示推理鏈路真的是一種營(yíng)銷(xiāo)嗎?
OpenAI和Anthropic冠冕堂皇的理由是優(yōu)化用戶(hù)體驗(yàn)界面,避免信息過(guò)載。但這個(gè)問(wèn)題其實(shí)觸及到這幾家公司深層次顧慮,一方面是模型的內(nèi)部工作機(jī)制(如微調(diào)策略、特定任務(wù)的優(yōu)化方法)可能會(huì)讓競(jìng)爭(zhēng)對(duì)手進(jìn)行逆向工程,而且保持黑盒化的推理過(guò)程也避免了外界過(guò)分渲染這些工具的黑歷史——從一開(kāi)始,ChatGPT就很有爭(zhēng)議性地不斷爬取《紐約時(shí)報(bào)》、《華爾街日?qǐng)?bào)》等公眾媒體和數(shù)據(jù)資源進(jìn)行語(yǔ)料訓(xùn)練,其合規(guī)性經(jīng)營(yíng)一再遭受質(zhì)疑,并一度走到法律訴訟層面。
由此可見(jiàn),OpenAI、谷歌和Anthropic這些本來(lái)通過(guò)營(yíng)銷(xiāo)起家的AI模型公司無(wú)法效仿DeepSeek所謂的“營(yíng)銷(xiāo)大法”,非不為而實(shí)不能。
結(jié)語(yǔ):模型蒸餾是DeepSeek給全人類(lèi)的美好饋贈(zèng)
Semianalysis總裁Dylan Patel和Anthropic 的CEO Dario Amodei對(duì)DeepSeek評(píng)述還有一個(gè)共性,就是認(rèn)為R1遠(yuǎn)不如V3有趣,其主要論據(jù)是R1很可能用了模型蒸餾。
在保證模型性能與效率的同時(shí),推動(dòng)AI技術(shù)的普惠化,將其變?yōu)樗碗娨粯拥墓伯a(chǎn)品,模型數(shù)據(jù)蒸餾和用戶(hù)知識(shí)蒸餾是一種必然之路,它不僅優(yōu)化了資源利用,加速模型向本地部署和端側(cè)推理遷移,對(duì)構(gòu)建可持續(xù)、高效的AI生態(tài)具有重要意義。
OpenAI團(tuán)隊(duì)創(chuàng)立就是對(duì)谷歌AI商業(yè)化路線(xiàn)的一種逆反,奧爾特曼和馬斯克當(dāng)時(shí)秉承了一種為全人類(lèi)尋找AGI途徑的愿景才取了“OpenAI”這個(gè)名字,如今OpenAI變成“CloseAI”其實(shí)已經(jīng)偏離了初心。
Dario Amodei抨擊DeepSeek搞蒸餾有侵犯知識(shí)產(chǎn)權(quán)風(fēng)險(xiǎn)。但如前所述,這幾家美國(guó)大廠都是吃到了數(shù)據(jù)時(shí)代紅利,在《紐約時(shí)報(bào)》反應(yīng)過(guò)來(lái)要搞法律訴訟之前先把語(yǔ)料數(shù)據(jù)“竊取”了過(guò)去,吃下去怎么可能再吐出來(lái)?
曾幾何時(shí),艱深晦澀的AI技術(shù)曾是學(xué)院派們的禁臠。英偉達(dá)的CUDA軟件開(kāi)發(fā)者系統(tǒng)平臺(tái),當(dāng)初讓先驅(qū)者們有機(jī)會(huì)在商業(yè)市場(chǎng)中一試身手。很快,AI的重心從斯坦福大學(xué)、多倫多大學(xué)和加州理工等轉(zhuǎn)移到了初創(chuàng)公司中。
辛頓和李飛飛加入了谷歌,吳恩達(dá)去了百度,奧爾特曼和他鬧宮斗的蘇茨克維等等一起創(chuàng)辦了OpenAI,他們一起把AI帶向了公眾視野。
一切的AI生產(chǎn)要素的流動(dòng),其實(shí)是一種人才、軟硬件技術(shù)以及資本市場(chǎng)的變相“蒸餾”。本來(lái)就是脫胎自O(shè)penAI的Anthropic也是用戶(hù)知識(shí)蒸餾的最大受益者。
前一段時(shí)間李飛飛團(tuán)隊(duì)“50美元”復(fù)刻DeepSeek-R1,此舉恰恰蘊(yùn)藏著梁文峰們的美好愿景——推動(dòng)知識(shí)與信息的平權(quán),AI應(yīng)成為造福全人類(lèi)的公共產(chǎn)品。
本文系觀察者網(wǎng)獨(dú)家稿件,文章內(nèi)容純屬作者個(gè)人觀點(diǎn),不代表平臺(tái)觀點(diǎn),未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責(zé)任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。
- 原標(biāo)題:從四個(gè)角度全面駁斥美方對(duì)DeepSeek的質(zhì)疑和污蔑 本文僅代表作者個(gè)人觀點(diǎn)。
- 責(zé)任編輯: 李昊 
-
我國(guó)成功發(fā)射衛(wèi)星互聯(lián)網(wǎng)低軌衛(wèi)星
2025-02-11 19:20 航空航天 -
蹭熱度?ai.com重定向至DeepSeek
2025-02-10 14:35 人工智能 -
-
“中國(guó)物理學(xué)研究領(lǐng)先世界,美國(guó)機(jī)構(gòu)被擠出前十”
2025-02-09 09:14 科技前沿 -
撬開(kāi)日本海關(guān)的口:日本半導(dǎo)體設(shè)備對(duì)華依賴(lài)度有多高?
2025-02-06 08:06 心智觀察所 -
中國(guó)平臺(tái),集中上線(xiàn)
2025-02-04 21:12 -
“人造太陽(yáng)”再創(chuàng)紀(jì)錄,是中國(guó)式科研方法論又一次勝利
2025-02-04 13:05 心智觀察所 -
“大洋一號(hào)”功勛船舶將升級(jí)改造
2025-02-02 15:35 -
“霸榜全球140個(gè)市場(chǎng)”,拉新最多的是…
2025-02-01 22:06 觀察者頭條 -
突破70多年來(lái)的傳統(tǒng)認(rèn)知!他們發(fā)現(xiàn)距地球16萬(wàn)公里的“太空合聲”
2025-02-01 16:53 天文 -
中國(guó)光子毫米波雷達(dá)技術(shù)取得突破性進(jìn)展
2025-01-31 22:54 科技前沿 -
果然,臺(tái)當(dāng)局又跳了出來(lái)
2025-01-31 22:01 臺(tái)灣 -
英偉達(dá)平臺(tái)上線(xiàn)DeepSeek
2025-01-31 18:18 -
阿斯麥CEO:DeepSeek,好消息
2025-01-30 09:34 -
20光年外,科學(xué)家又發(fā)現(xiàn)“超級(jí)地球”
2025-01-29 19:03 -
-
理解DeepSeek的中國(guó)式創(chuàng)新,要先回顧深度學(xué)習(xí)的歷史
2025-01-27 08:03 心智觀察所 -
探索宇宙線(xiàn)起源之謎再添“觀天”利器
2025-01-21 20:09 天文 -
最大載重1.9噸,國(guó)產(chǎn)大型無(wú)人機(jī)首次實(shí)現(xiàn)量產(chǎn)交付
2025-01-20 22:12 中國(guó)精造 -
我國(guó)成功發(fā)射云遙一號(hào)37~40星等5顆衛(wèi)星
2025-01-20 21:59 航空航天
相關(guān)推薦 -
“2027年起,整個(gè)產(chǎn)業(yè)將拱手讓給中國(guó)” 評(píng)論 56“不如申請(qǐng)成中國(guó)一省” ,德國(guó)鋰企竟如此激將歐盟 評(píng)論 90美兩員“大將”施壓未果,日本反倒成了“難啃的骨頭” 評(píng)論 91美國(guó)放風(fēng):伊朗有動(dòng)作了 評(píng)論 90靠萬(wàn)斯“決勝一票”,“大而美”法案驚險(xiǎn)闖關(guān)參議院 評(píng)論 184最新聞 Hot
-
美方撤銷(xiāo)對(duì)華乙烷出口限制
-
特朗普參觀“鱷魚(yú)惡魔島”:拜登就想把我關(guān)在這兒,這XX養(yǎng)的
-
公安部通報(bào):陳某為吸粉引流編造“工行假金條”,已被依法追責(zé)
-
“2027年起,整個(gè)產(chǎn)業(yè)將拱手讓給中國(guó)”
-
特朗普威脅:敢礙事,就逮捕你
-
“7年前就發(fā)現(xiàn)問(wèn)題了,一直沒(méi)修”
-
“不如申請(qǐng)成中國(guó)一省” ,德國(guó)鋰企竟如此激將歐盟
-
終于換了,特朗普:我很滿(mǎn)意
-
要跟中國(guó)對(duì)著干?“剛果(金),別斷送發(fā)展機(jī)遇”
-
美兩員“大將”施壓未果,日本反倒成了“難啃的骨頭”
-
白宮找補(bǔ):美國(guó)很強(qiáng),不信去問(wèn)伊朗
-
何君堯:建議給皇后大道、維多利亞公園改名
-
“美國(guó)自毀長(zhǎng)城,中企憑高性?xún)r(jià)比一路高歌猛進(jìn)”
-
兩國(guó)矛盾激化,阿媒突然發(fā)文:收到匿名材料,是俄軍擊中的
-
裝不裝空調(diào),法國(guó)政客都能吵起來(lái)
-
潛入醫(yī)院裝電詐設(shè)備,騙走30萬(wàn)!今年已發(fā)生多起
-