-
DeepSeek-R1模型震驚硅谷,美媒:制裁反而促進(jìn)中國(guó)創(chuàng)新
最后更新: 2025-01-27 15:17:04【文/觀察者網(wǎng) 陳思佳】這兩天,中國(guó)人工智能公司深度求索(DeepSeek)發(fā)布的大模型DeepSeek-R1震動(dòng)業(yè)界,該模型使用更低的成本和更小的算力規(guī)模,實(shí)現(xiàn)了足以匹敵美國(guó)頂尖AI模型的效果。這一成果引發(fā)全球科技行業(yè)高度關(guān)注,西方媒體也發(fā)文感嘆“中國(guó)AI模型震驚硅谷”。
最新消息顯示,DeepSeek已經(jīng)登頂了中國(guó)和美國(guó)的蘋(píng)果App Store應(yīng)用商店,排名第一,將ChatGPT一舉超越。對(duì)于一款中國(guó)大模型來(lái)說(shuō),能夠在美國(guó)力壓ChatGPT,是絕無(wú)僅有的歷史性一刻。
據(jù)美國(guó)《華爾街日?qǐng)?bào)》當(dāng)?shù)貢r(shí)間1月26日?qǐng)?bào)道,DeepSeek-R1的出色表現(xiàn)已經(jīng)給美國(guó)科技行業(yè)留下深刻印象,從業(yè)者紛紛稱贊深度求索的工作取得了重大突破。OpenAI公司前高管扎克·卡斯(Zack Kass)直言,美國(guó)試圖通過(guò)制裁限制中國(guó)的AI發(fā)展,但資源的限制反而激發(fā)了中國(guó)科研人員的創(chuàng)造力。
深度求索在1月20日發(fā)布了DeepSeek-R1模型,該公司表示,DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況,極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,其性能比肩美國(guó)OpenAI o1正式版。
為促進(jìn)技術(shù)社區(qū)的充分交流與創(chuàng)新協(xié)作,深度求索還公開(kāi)了DeepSeek-R1訓(xùn)練技術(shù)。
DeepSeek-R1、OpenAI-o1-1217和DeepSeek-V3的性能比較 DeepSeek微信公眾號(hào)
一些第三方測(cè)試結(jié)果也顯示,DeepSeek-R1的表現(xiàn)足以匹敵美國(guó)頂尖AI模型。美國(guó)加州大學(xué)伯克利分校研究人員設(shè)立的聊天機(jī)器人競(jìng)技場(chǎng)(Chatbot Arena)平臺(tái)上,DeepSeek-R1和去年12月發(fā)布的DeepSeek-V3的性能表現(xiàn)均位列前十。
不僅如此,DeepSeek的開(kāi)發(fā)成本和使用的算力規(guī)模都遠(yuǎn)低于美國(guó)頂尖AI公司。先前發(fā)布的DeepSeek-V3在僅使用2048顆英偉達(dá)H800 GPU的情況下,完成了6710億參數(shù)模型的訓(xùn)練,成本約為560萬(wàn)美元,這遠(yuǎn)低于其他頂級(jí)模型的訓(xùn)練成本。美媒指出,H800的算力要弱于英偉達(dá)H100等芯片,美國(guó)限制對(duì)華出口此類高性能芯片。
《華爾街日?qǐng)?bào)》提到,作為對(duì)比,美國(guó)AI企業(yè)、Claude模型開(kāi)發(fā)商Anthropic首席執(zhí)行官達(dá)里奧·阿莫代伊(Dario Amodei)去年曾透露,該公司構(gòu)建模型的成本約為1億至10億美元。
與其他一些頂尖大模型不同,DeepSeek-R1沒(méi)有使用傳統(tǒng)的監(jiān)督微調(diào)(SFT)方法,而是專注于強(qiáng)化學(xué)習(xí)(RL),這意味著該模型跳過(guò)了使用人工標(biāo)準(zhǔn)數(shù)據(jù)訓(xùn)練的“模仿”環(huán)節(jié)。
英偉達(dá)高級(jí)研究科學(xué)家范麟熙(Jim Fan)稱贊DeepSeek取得了突破,他在社交平臺(tái)X上發(fā)文稱,DeepSeek-R1完全由強(qiáng)化學(xué)習(xí)驅(qū)動(dòng),“這讓人想起了AlphaZero,從零開(kāi)始學(xué)習(xí)圍棋、將棋和國(guó)際象棋,而不是先模仿人類大師的動(dòng)作。這是論文中最重要的收獲?!?
DeepSeek-R1的表現(xiàn)引起美國(guó)科技行業(yè)的高度關(guān)注。硅谷風(fēng)險(xiǎn)投資家馬克·安德森(Marc Andreessen)表示:“DeepSeek-R1是我見(jiàn)過(guò)的最令人驚嘆,最令人印象深刻的突破之一?!?/strong>
舊金山AI硬件公司Positron的聯(lián)合創(chuàng)始人巴雷特·伍德塞德(Barrett Woodside)表示,最近他和同事一直在討論DeepSeek的開(kāi)源模型,“這太酷了?!?
一些美國(guó)企業(yè)也開(kāi)始在工作中使用DeepSeek。硅谷一家創(chuàng)業(yè)公司的聯(lián)合創(chuàng)始人安東尼·普奧(Anthony Poo)告訴《華爾街日?qǐng)?bào)》,他們?cè)仁褂肅laude模型預(yù)測(cè)財(cái)務(wù)回報(bào),但現(xiàn)在已轉(zhuǎn)向DeepSeek,兩者性能相似,使用DeepSeek的成本僅為Claude的四分之一。
普奧說(shuō):“OpenAI的模型有著極佳的性能,但我們不想為我們不需要的能力付費(fèi)。”
截至北京時(shí)間今早,DeepSeek在美區(qū)蘋(píng)果App Store免費(fèi)榜上已經(jīng)排在第一位,力壓此前霸榜的ChatGPT。而就在昨天早上,DeepSeek還沒(méi)有擠進(jìn)榜單前五,顯示出過(guò)去24小時(shí)發(fā)酵速度之快。在國(guó)區(qū)蘋(píng)果App Store免費(fèi)榜,DeepSeek也已登頂。
DeepSeek已在蘋(píng)果App Store國(guó)區(qū)和美區(qū)免費(fèi)榜登頂
近年來(lái),美國(guó)在芯片等領(lǐng)域?qū)χ袊?guó)實(shí)施出口限制,試圖打壓中國(guó)在AI等領(lǐng)域的發(fā)展,但深度求索依然能構(gòu)建出匹敵美國(guó)頂尖科技公司的AI模型。OpenAI前高管扎克·卡斯直言,美國(guó)的限制未能阻止DeepSeek的進(jìn)步,“這凸顯了一個(gè)深刻的教訓(xùn):資源限制反而能激發(fā)創(chuàng)造力?!?
數(shù)字新聞雜志The Wire China發(fā)文稱,DeepSeek-R1的發(fā)布將迫使懷疑論者重新評(píng)估中國(guó)的技術(shù)發(fā)展。深度求索對(duì)開(kāi)源承諾的堅(jiān)持也與OpenAI的專有策略形成鮮明對(duì)比,深度求索允許全球企業(yè)和開(kāi)發(fā)者共同開(kāi)發(fā)和改進(jìn)技術(shù),OpenAI則限制對(duì)其系統(tǒng)的訪問(wèn)以維護(hù)競(jìng)爭(zhēng)優(yōu)勢(shì)。
該雜志指出,美國(guó)決策者應(yīng)該反思,通過(guò)設(shè)置障礙來(lái)確保領(lǐng)先地位的方法是否還行得通。美國(guó)的出口管制促使中國(guó)加速實(shí)現(xiàn)技術(shù)的自給自足,中美在芯片等領(lǐng)域的技術(shù)差距正逐漸縮小,美國(guó)的制裁雖然具有破壞性,卻可能反過(guò)來(lái)助推中國(guó)的創(chuàng)新能力。
文章寫(xiě)道,美國(guó)的出口管制不僅削弱了美國(guó)科技公司的收入,也導(dǎo)致全球半導(dǎo)體供應(yīng)鏈變得愈發(fā)“支離破碎”,“美國(guó)越是專注于遏制對(duì)手而不解決自身的缺陷,就越有可能加速其領(lǐng)先地位的喪失。”
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
標(biāo)簽 人工智能- 責(zé)任編輯: 陳思佳 
-
加拿大媒體炮轟:我們都快被特朗普蛐蛐死了,你人呢?
2025-01-27 14:51 應(yīng)對(duì)特朗普沖擊波 -
美國(guó)務(wù)院下死令
2025-01-27 14:48 美國(guó)政治 -
“我永遠(yuǎn)不會(huì)反華,美國(guó)收買(mǎi)不了我”
2025-01-27 14:11 中國(guó)外交 -
“伊朗還盯著呢!怎么能把他們安保撤了?”
2025-01-27 12:17 應(yīng)對(duì)特朗普沖擊波 -
他又挑撥!越南總理表態(tài)
2025-01-27 11:49 南海局勢(shì) -
濟(jì)州航空空難初步調(diào)查報(bào)告公布:撞機(jī)4分鐘前黑匣子停止記錄
2025-01-27 11:46 三八線之南 -
丹麥被貼臉開(kāi)大:笑死,多搞幾條狗,你也好意思…
2025-01-27 11:08 應(yīng)對(duì)特朗普沖擊波 -
“美中如果有更多的雙贏元素,那就太好了”
2025-01-27 10:50 中美關(guān)系 -
芝加哥、亞特蘭大、洛杉磯……美國(guó)開(kāi)始非法移民大抓捕
2025-01-27 10:31 美國(guó)政治 -
軍機(jī)遣返移民被拒后,特朗普加稅25%!哥倫比亞硬剛
2025-01-27 10:11 應(yīng)對(duì)特朗普沖擊波 -
中薩(摩亞)政府簽署互免簽證協(xié)定
2025-01-27 10:01 -
巴勒斯坦、約旦、埃及全都反對(duì)!哈馬斯回懟
2025-01-27 08:43 巴以恩仇錄 -
白宮:黎以?;饏f(xié)議延長(zhǎng)至2月18日
2025-01-27 08:20 -
官宣!盧卡申科勝選
2025-01-27 08:00 -
馬斯克提議:將“英吉利海峽”更名為“喬治·華盛頓海峽”
2025-01-27 07:43 應(yīng)對(duì)特朗普沖擊波 -
美新任防長(zhǎng)與以總理通話:美國(guó)將與以色列站在一起
2025-01-27 07:33 巴以恩仇錄 -
伊朗“加沙”重型無(wú)人機(jī)首次亮相
2025-01-27 07:05 伊朗局勢(shì) -
拉脫維亞與瑞典的一條水下光纜遭到損壞
2025-01-27 07:05 歐洲亂局 -
盧卡申科將贏得白俄大選:出口民調(diào)87.6%
2025-01-27 07:05 -
李強(qiáng)同外國(guó)專家舉行新春座談會(huì)
2025-01-27 07:05
相關(guān)推薦 -
“2027年起,整個(gè)產(chǎn)業(yè)將拱手讓給中國(guó)” 評(píng)論 56“不如申請(qǐng)成中國(guó)一省” ,德國(guó)鋰企竟如此激將歐盟 評(píng)論 90美兩員“大將”施壓未果,日本反倒成了“難啃的骨頭” 評(píng)論 91美國(guó)放風(fēng):伊朗有動(dòng)作了 評(píng)論 90靠萬(wàn)斯“決勝一票”,“大而美”法案驚險(xiǎn)闖關(guān)參議院 評(píng)論 184最新聞 Hot
-
美方撤銷(xiāo)對(duì)華乙烷出口限制
-
特朗普參觀“鱷魚(yú)惡魔島”:拜登就想把我關(guān)在這兒,這XX養(yǎng)的
-
公安部通報(bào):陳某為吸粉引流編造“工行假金條”,已被依法追責(zé)
-
“2027年起,整個(gè)產(chǎn)業(yè)將拱手讓給中國(guó)”
-
特朗普威脅:敢礙事,就逮捕你
-
“7年前就發(fā)現(xiàn)問(wèn)題了,一直沒(méi)修”
-
“不如申請(qǐng)成中國(guó)一省” ,德國(guó)鋰企竟如此激將歐盟
-
終于換了,特朗普:我很滿意
-
要跟中國(guó)對(duì)著干?“剛果(金),別斷送發(fā)展機(jī)遇”
-
美兩員“大將”施壓未果,日本反倒成了“難啃的骨頭”
-
白宮找補(bǔ):美國(guó)很強(qiáng),不信去問(wèn)伊朗
-
何君堯:建議給皇后大道、維多利亞公園改名
-
“美國(guó)自毀長(zhǎng)城,中企憑高性價(jià)比一路高歌猛進(jìn)”
-
兩國(guó)矛盾激化,阿媒突然發(fā)文:收到匿名材料,是俄軍擊中的
-
裝不裝空調(diào),法國(guó)政客都能吵起來(lái)
-
潛入醫(yī)院裝電詐設(shè)備,騙走30萬(wàn)!今年已發(fā)生多起
-