-
熊節(jié)、塞爾吉奧·阿馬德烏:DeepSeek為什么要開源?這可能與人工智能的領(lǐng)導(dǎo)權(quán)息息相關(guān)
【導(dǎo)讀】 本文由deepseek翻譯,經(jīng)觀察者網(wǎng)編輯加工潤色后發(fā)布。
【文/觀察者網(wǎng)專欄作者 熊節(jié)、塞爾吉奧·阿馬德烏】
人工智能領(lǐng)導(dǎo)權(quán)之爭——中國與開源
為什么技術(shù)領(lǐng)導(dǎo)權(quán)如此重要?如何定義人工智能(AI)領(lǐng)域的技術(shù)領(lǐng)導(dǎo)權(quán)?人工智能是一項(xiàng)橫跨多個(gè)領(lǐng)域的技術(shù),其進(jìn)步會(huì)對經(jīng)濟(jì)、社會(huì)和國家安全產(chǎn)生深遠(yuǎn)影響。技術(shù)領(lǐng)導(dǎo)權(quán)首先提供了一系列競爭優(yōu)勢,因?yàn)榘l(fā)明和創(chuàng)新賦予開發(fā)者其他人所不具備的收益和利益。其次,技術(shù)領(lǐng)導(dǎo)權(quán)是一個(gè)關(guān)鍵的地緣政治因素,因?yàn)樗軌蛴绊懭驑?biāo)準(zhǔn)、規(guī)范和法規(guī)的制定。第三,技術(shù)領(lǐng)導(dǎo)權(quán)可以推動(dòng)創(chuàng)新生態(tài)系統(tǒng)的形成,鞏固長期發(fā)展。第四,領(lǐng)導(dǎo)權(quán)可以在國際威脅(包括軍事威脅)的背景下增強(qiáng)安全性。第五,領(lǐng)導(dǎo)權(quán)能夠引導(dǎo)技術(shù)發(fā)展,以實(shí)現(xiàn)社會(huì)、環(huán)境和政治目標(biāo)。
從技術(shù)政治的角度來看,技術(shù)科學(xué)并非中立,它對權(quán)力關(guān)系和社會(huì)組織具有深遠(yuǎn)影響(Winner,2020)[1]。人工智能的領(lǐng)導(dǎo)權(quán)不僅僅是開發(fā)最先進(jìn)的技術(shù),還包括創(chuàng)建一個(gè)能夠?qū)崿F(xiàn)更廣泛社會(huì)價(jià)值和目標(biāo)的社會(huì)技術(shù)環(huán)境,確保創(chuàng)新遵循特定的目的。人工智能的發(fā)展軌跡可能會(huì)優(yōu)先考慮提高經(jīng)濟(jì)系統(tǒng)的生產(chǎn)力,或者旨在尋找社會(huì)公正和環(huán)境可持續(xù)的解決方案。它可能尋求集中權(quán)力并加強(qiáng)國際不對稱性,或者促進(jìn)知識的傳播和公平發(fā)展。它可能抑制人口和文化的創(chuàng)造力,或者確保技術(shù)多樣性。它可能與權(quán)力的集中或分散密切相關(guān)。
目前,人工智能的領(lǐng)導(dǎo)權(quán)掌握在美國手中,主要由所謂的“科技巨頭”主導(dǎo)。這些公司控制著開發(fā)現(xiàn)有人工智能(尤其是以深度學(xué)習(xí)為主導(dǎo)的人工智能)不可或缺的資源。
我們都知道,深度學(xué)習(xí)方法基于統(tǒng)計(jì)學(xué)和概率學(xué),用于從大量數(shù)據(jù)中分類和提取模式。為了執(zhí)行這些操作,人工智能開發(fā)者依賴于強(qiáng)大的計(jì)算能力。訓(xùn)練一個(gè)像ChatGPT這樣先進(jìn)的人工智能模型需要數(shù)百萬美元,并且需要大量時(shí)間使用專用硬件進(jìn)行處理,例如專為這些任務(wù)設(shè)計(jì)的芯片。這些芯片被稱為“AI推理芯片”或“推理加速器”,它們能夠在更短的時(shí)間內(nèi)取得更好的結(jié)果。例如,谷歌的Tensor Processing Units(TPUs)專為推理和訓(xùn)練優(yōu)化;神經(jīng)處理單元(NPUs)或神經(jīng)網(wǎng)絡(luò)加速器常用于移動(dòng)設(shè)備和邊緣計(jì)算;圖形處理單元(GPUs)則用于訓(xùn)練和推理。
目前,這些芯片對于圖像識別、自然語言處理和其他實(shí)時(shí)人工智能任務(wù)至關(guān)重要。
美國政府長期以來一直采取限制尖端芯片獲取的政策,主要目的是延緩中國和其他被視為對手國家的AI發(fā)展,目標(biāo)是保持美國在AI領(lǐng)域的領(lǐng)導(dǎo)地位。隨著唐納德·特朗普于2025年1月就職,技術(shù)封鎖政策進(jìn)一步加劇。此外,美國總統(tǒng)宣布了一項(xiàng)5000億美元的“星際之門”項(xiàng)目投資。特朗普的計(jì)劃是與甲骨文、OpenAI和軟銀等公司合作,在美國開發(fā)物理和虛擬的AI基礎(chǔ)設(shè)施,以“推動(dòng)下一代AI的發(fā)展”[2]。英偉達(dá)、Arm和微軟等公司是該項(xiàng)目的合作伙伴,該項(xiàng)目已在德克薩斯州開始實(shí)施,并將在未來四年內(nèi)在美國各個(gè)地區(qū)建設(shè)“巨型數(shù)據(jù)中心”[3]。
以埃隆·馬斯克為代表的美國科技精英認(rèn)為,人工智能正在接近“奇點(diǎn)”——即人工通用智能(AGI)的出現(xiàn)。他們聲稱,AGI將完全超越并取代人類在所有智力領(lǐng)域的勞動(dòng),如果美國率先實(shí)現(xiàn)AGI,其技術(shù)霸權(quán)將不可撼動(dòng)。然而,無論是ChatGPT還是DeepSeek,都沒有顯示出接近AGI的跡象。它們是處理自然語言的有用工具,并在特定領(lǐng)域展示了有限的推理能力,但沒有證據(jù)表明它們——或任何已知的AI研究——正在接近AGI。
AGI比起一般的AI擅長以更像人類的方式去執(zhí)行任務(wù)
開源的轉(zhuǎn)折點(diǎn)
2024年5月,一家名為DeepSeek的中國小公司推出了其大型語言模型(LLM),該模型受到Llama的啟發(fā),Llama是一個(gè)禁止商業(yè)使用的受限研究協(xié)議下的模型。開源模型DeepSeek V2的突出之處在于其前所未有的成本效益。DeepSeek將推理成本降低至每百萬個(gè)token僅1元人民幣,約為Llama3 70B的七分之一,遠(yuǎn)低于GPT-4。
Token是語言模型用于處理和理解人類語言的基本文本單位,根據(jù)上下文和語言,token可以被視為單詞、音節(jié)甚至單個(gè)字符的“塊”。AI模型將文本轉(zhuǎn)換為token,并以數(shù)字形式表示。這些數(shù)字隨后由模型處理以生成響應(yīng)或執(zhí)行任務(wù)。因此,文本中的token數(shù)量直接影響成本和處理時(shí)間。token越多,推理越復(fù)雜且耗時(shí)。
與所有中國公司一樣,DeepSeek也受到美國政府尖端芯片封鎖的限制。這促使DeepSeek的領(lǐng)導(dǎo)者及其團(tuán)隊(duì)更加專注于研究和優(yōu)化。梁文鋒在2024年7月的一次采訪中表示:“我們的出發(fā)點(diǎn)不是抓住機(jī)會(huì)發(fā)財(cái),而是推進(jìn)到技術(shù)前沿,以促進(jìn)整個(gè)生態(tài)系統(tǒng)的發(fā)展。”[4] 這家中國公司試圖引領(lǐng)AI發(fā)展的意圖顯而易見。為了實(shí)現(xiàn)這一目標(biāo),DeepSeek并沒有局限于組織數(shù)據(jù)并在現(xiàn)有云平臺(tái)上運(yùn)行。團(tuán)隊(duì)努力在尖端芯片稀缺的情況下尋找解決方案。這需要改變架構(gòu)、嘗試新程序以及廣泛的應(yīng)用數(shù)學(xué)。
DeepSeek的年輕領(lǐng)導(dǎo)者梁文鋒表示:“我們在創(chuàng)新方面缺乏的絕對不是資本,而是信心和如何組織高密度人才以實(shí)現(xiàn)有效創(chuàng)新的知識?!盵5] 他繼續(xù)說道:“創(chuàng)新并不完全由商業(yè)驅(qū)動(dòng),還需要好奇心和創(chuàng)造力。我們陷入了過去的慣性,但這也是暫時(shí)的。”[6] 梁文鋒的理念是減少模仿,增加研究。他主張押注開源模型,不是為了使用它們,而是為了改進(jìn)它們,并找到需要更少計(jì)算資源的路徑。
開源是DeepSeek戰(zhàn)略的核心,但對騰訊、百度和阿里巴巴等其他中國公司來說可能并非如此。然而,開源允許知識在全球范圍內(nèi)傳播,從而以更快、更包容的速度產(chǎn)生新發(fā)現(xiàn)的可能性。梁文峰表示:“實(shí)際上,開源和論文的發(fā)表并沒有損失。對于技術(shù)團(tuán)隊(duì)來說,被追隨是一種巨大的成就感。事實(shí)上,開源更像是一種文化行為,而不是商業(yè)行為,因?yàn)榻o予實(shí)際上是一種額外的榮譽(yù),這樣做的公司也會(huì)更具有文化吸引力。”[7]
開源不是一種技術(shù),而是一個(gè)基于知識共享的開發(fā)過程。通常,它鼓勵(lì)組織愿意協(xié)作解決問題并通過更新維護(hù)解決方案的社區(qū)。像Mistral 7B(Mistral AI)和Falcon(技術(shù)創(chuàng)新研究所)這樣的語言模型是開源的,并在Apache 2.0許可下發(fā)布;強(qiáng)化學(xué)習(xí)模型Stable-Baselines3也是開源的,采用MIT許可證。
那么,為什么DeepSeek的模型如此重要?因?yàn)樗嵏擦巳駻I領(lǐng)導(dǎo)權(quán)的競爭。如何做到的?通過大幅降低大型語言模型的計(jì)算成本。
開源對于知識傳播至關(guān)重要,但并不能解決訓(xùn)練和運(yùn)行模型所需的計(jì)算基礎(chǔ)設(shè)施問題。DeepSeek展示了一個(gè)高性能且處理需求較低的開源模型。
DeepSeek-R1已經(jīng)展示了比OpenAI的ChatGPT o1更強(qiáng)的推理能力,而其成本(包括訓(xùn)練和使用)顯著降低。通過開源其模型,DeepSeek促進(jìn)了大型語言模型的民主化——使技術(shù)基礎(chǔ)設(shè)施欠發(fā)達(dá)的小公司、國家甚至個(gè)人能夠基于DeepSeek訓(xùn)練自己的“主權(quán)AI”,而無需依賴科技巨頭的產(chǎn)品或?qū)?shù)據(jù)交給這些公司。印度尼西亞和印度已經(jīng)開始使用DeepSeek作為基礎(chǔ)構(gòu)建自己的AI基礎(chǔ)設(shè)施[8]。在此之前,只有美國和中國有能力訪問如此高水平的大型語言模型。
上表展示了在lighteval上OpenR1-Qwen-7B、DeepSeek-Distill-Qwen-7B和OpenThinker-7B的性能對比,可以看出在數(shù)學(xué)成績上,OpenR1-Qwen-7B和DeepSeek-Distill-Qwen-7B差距不是非常明顯。36氪
-
本文僅代表作者個(gè)人觀點(diǎn)。
- 責(zé)任編輯: 鄭樂歡 
-
鋰電池“打一針”就能“重生”!《自然》刊登我國科研團(tuán)隊(duì)新發(fā)現(xiàn)
2025-02-13 06:42 -
從四個(gè)角度全面駁斥美方對DeepSeek的質(zhì)疑和污蔑
2025-02-12 07:34 心智觀察所 -
我國成功發(fā)射衛(wèi)星互聯(lián)網(wǎng)低軌衛(wèi)星
2025-02-11 19:20 航空航天 -
蹭熱度?ai.com重定向至DeepSeek
2025-02-10 14:35 人工智能 -
中國半導(dǎo)體產(chǎn)業(yè)要長遠(yuǎn)發(fā)展,這個(gè)問題必須解決好
2025-02-10 13:57 心智觀察所 -
“中國物理學(xué)研究領(lǐng)先世界,美國機(jī)構(gòu)被擠出前十”
2025-02-09 09:14 科技前沿 -
撬開日本海關(guān)的口:日本半導(dǎo)體設(shè)備對華依賴度有多高?
2025-02-06 08:06 心智觀察所 -
中國平臺(tái),集中上線
2025-02-04 21:12 -
“人造太陽”再創(chuàng)紀(jì)錄,是中國式科研方法論又一次勝利
2025-02-04 13:05 心智觀察所 -
“大洋一號”功勛船舶將升級改造
2025-02-02 15:35 -
“霸榜全球140個(gè)市場”,拉新最多的是…
2025-02-01 22:06 觀察者頭條 -
突破70多年來的傳統(tǒng)認(rèn)知!他們發(fā)現(xiàn)距地球16萬公里的“太空合聲”
2025-02-01 16:53 天文 -
中國光子毫米波雷達(dá)技術(shù)取得突破性進(jìn)展
2025-01-31 22:54 科技前沿 -
果然,臺(tái)當(dāng)局又跳了出來
2025-01-31 22:01 臺(tái)灣 -
英偉達(dá)平臺(tái)上線DeepSeek
2025-01-31 18:18 -
阿斯麥CEO:DeepSeek,好消息
2025-01-30 09:34 -
20光年外,科學(xué)家又發(fā)現(xiàn)“超級地球”
2025-01-29 19:03 -
DeepSeek超越ChatGPT,登頂美國區(qū)免費(fèi)APP榜單
2025-01-27 09:02 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
理解DeepSeek的中國式創(chuàng)新,要先回顧深度學(xué)習(xí)的歷史
2025-01-27 08:03 心智觀察所 -
探索宇宙線起源之謎再添“觀天”利器
2025-01-21 20:09 天文
相關(guān)推薦 -
最新聞 Hot
-
哈馬斯接受?;鹂蚣?,特朗普:好事
-
江蘇:縣級以下禁止開發(fā)政務(wù)服務(wù)APP
-
“家庭主義者”盧特尼克,把歐盟鴿了
-
通話通了個(gè)寂寞?特朗普不滿,克宮回應(yīng)
-
“盯上”西非礦產(chǎn),特朗普將會(huì)晤非洲五國
-
英前防相挑釁:臺(tái)灣問題上,西方對中國簡直慫包…
-
操心中國,美國“黑手”又要伸向馬來西亞和泰國
-
“特朗普要想訪華,先把臺(tái)灣問題說清楚”
-
“對以色列感到憤怒和警惕,沙特將與伊朗保持和解”
-
特朗普又給日本背后捅刀,逼得臺(tái)積電沒法了…
-
“大而美”法案通過,馬斯克表態(tài)
-
朱時(shí)茂自曝被騙錢,“我還是反詐大使”
-
英F-35“趴窩”印度機(jī)場20天,快被“玩壞”了…
-
特朗普要求“大搞特搞”,美團(tuán)體急了:沒中國不行
-
“美國人,真正該擔(dān)心的時(shí)候到了”
-
涉及中國,韓企與美國“一拍即合”
-