-
芯片問題不用擔(dān)心,華為是如何應(yīng)用“系統(tǒng)論”的?
最后更新: 2025-06-25 10:11:54(文/觀察者網(wǎng) 呂棟)
“芯片問題其實(shí)沒必要擔(dān)心,用疊加和集群等方法,計(jì)算結(jié)果上與最先進(jìn)水平是相當(dāng)?shù)??!苯?,華為總裁任正非的一次公開發(fā)聲,增強(qiáng)了社會各界對中國AI發(fā)展的信心。
我們都知道,中國已經(jīng)形成了“百模千態(tài)”的大模型產(chǎn)業(yè),有多個(gè)大模型走在全球前列。但無論AI產(chǎn)業(yè)如何發(fā)展,算力都是驅(qū)動模型演進(jìn)的根本動力。隨著外部技術(shù)封鎖步步緊逼,國產(chǎn)算力能否擔(dān)當(dāng)大用?是否只能做推理而不能做復(fù)雜訓(xùn)練?很多人其實(shí)心里沒底。
“我們單芯片還是落后美國一代,我們用數(shù)學(xué)補(bǔ)物理,非摩爾補(bǔ)摩爾,用群計(jì)算補(bǔ)單芯片,在結(jié)果上也能達(dá)到實(shí)用狀況?!比握堑墓_發(fā)聲,給國內(nèi)AI產(chǎn)業(yè)吃下了一顆“定心丸”。
帶著對國產(chǎn)算力發(fā)展的關(guān)心,觀察者網(wǎng)與華為2012實(shí)驗(yàn)室的技術(shù)專家的做了一次交流,我們了解到,昇騰算力不僅實(shí)現(xiàn)推理性能全球領(lǐng)先,同時(shí)系統(tǒng)穩(wěn)定性也保持在高水平,能高效訓(xùn)出世界一流的萬億參數(shù)大模型。尤其是CloudMatrix 384超節(jié)點(diǎn)技術(shù),以系統(tǒng)補(bǔ)單點(diǎn),從堆芯片到拼架構(gòu),核心指標(biāo)比肩英偉達(dá),成為中國AI發(fā)展的堅(jiān)實(shí)算力底座。
芯片問題為何不用擔(dān)心?
在外部制裁圍堵下,芯片問題就像“達(dá)摩克里斯之劍”一樣,一直懸在中國產(chǎn)業(yè)界頭上。尤其隨著中美AI競爭愈發(fā)激烈,美國一方面竭力遏制中國先進(jìn)芯片制造的能力,另一方面又不斷收緊對英偉達(dá)高端芯片的出口管制,試圖讓中國AI產(chǎn)業(yè)在“算力囚籠”中止步不前。
但危中也有機(jī)。行業(yè)的發(fā)展趨勢是,當(dāng)Transformer這樣的大型神經(jīng)網(wǎng)絡(luò)模型橫空出世,萬億參數(shù)模型開始涌現(xiàn),對算力和顯存的需求呈爆炸式增長,單個(gè)GPU甚至單個(gè)服務(wù)器都難以招架,集群算力成為大勢所趨,這也給中國用系統(tǒng)方法解決算力困境帶來契機(jī)。
說起“系統(tǒng)論”,老一輩中國人可能并不陌生。錢學(xué)森的《論系統(tǒng)工程》,核心思想就是把研究對象看做一個(gè)整體而不是孤立的點(diǎn),通過整體優(yōu)化彌補(bǔ)單點(diǎn)落后。
華為制裁中突圍,正是受到系統(tǒng)工程的啟發(fā)。技術(shù)專家對觀察者網(wǎng)表示,算力基礎(chǔ)設(shè)施是復(fù)雜的系統(tǒng),華為把各個(gè)部分打通了,在內(nèi)部組織了算力會戰(zhàn),把華為云、模型、底座、芯片、硬件工程、基礎(chǔ)軟件的研發(fā)力量集結(jié)在一起,跨部門作戰(zhàn),深度協(xié)同。這樣的環(huán)境和機(jī)制,能夠產(chǎn)生協(xié)同效應(yīng)和系統(tǒng)工程的整合,實(shí)現(xiàn)了“大雜燴”技術(shù)的有效利用和協(xié)同創(chuàng)新。
基于系統(tǒng)工程,華為構(gòu)建了巨型算力基礎(chǔ)設(shè)施CloudMatrix 384超節(jié)點(diǎn),通過全對等高速互聯(lián)架構(gòu),讓384張昇騰卡可以像一臺計(jì)算機(jī)一樣工作。它的算力總規(guī)模達(dá)300Pflops,是英偉達(dá)旗艦NVL72的1.7倍;網(wǎng)絡(luò)互聯(lián)總帶寬達(dá)269TB/s,比英偉達(dá)NVL72提升107%;內(nèi)存總帶寬達(dá)1229TB/s,比英偉達(dá)NVL72提升113%。更關(guān)鍵的是,它還能擴(kuò)展為包含數(shù)萬卡的Atlas 900 SuperCluster超節(jié)點(diǎn)集群,未來可以支撐更大規(guī)模的模型演進(jìn)。
“超節(jié)點(diǎn)是復(fù)雜系統(tǒng),單卡的技術(shù)指標(biāo)并不代表系統(tǒng)的效能,我們‘系統(tǒng)工程’,要達(dá)到的是系統(tǒng)最佳,而不是單點(diǎn)最強(qiáng)。解決這些超復(fù)雜系統(tǒng)的問題需要懂理論,如系統(tǒng)論,控制論,信息論,計(jì)算數(shù)學(xué)等;同時(shí),我們通過數(shù)學(xué)的方法對計(jì)算系統(tǒng)進(jìn)行建模、仿真,想辦法把每一部分都用起來,做到不浪費(fèi),各個(gè)部分完美配合,高效協(xié)同?!比A為技術(shù)專家表示。
我們都知道,芯片制造遵循著“摩爾定律”,但前提是獲取先進(jìn)的設(shè)備材料。在制裁圍堵下,華為通過復(fù)雜系統(tǒng)優(yōu)化,實(shí)現(xiàn)了“非摩爾補(bǔ)摩爾”的效果,讓單芯片短板不再是制約。
華為技術(shù)專家指出,單芯片制程從7納米到5納米、3納米、2納米,每代性能提升不超過20%,總體能提升50%左右。華為通過高效的超節(jié)點(diǎn)系統(tǒng),提升了芯片算力利用率?!癕oE大模型訓(xùn)練,我們以前MFU(模型算力利用率)是30%,業(yè)界也是差不多這個(gè)水平,我們最新公布的數(shù)據(jù)提升到41%,實(shí)驗(yàn)室是45%多。從30%提升到45%,利用率相當(dāng)于提升了50%。在硬件什么也沒有改變的情況下,通過系統(tǒng)工程的優(yōu)化,資源的高效調(diào)度,一定程度彌補(bǔ)了芯片工藝的不足?!?
“西方不斷打補(bǔ)丁,我們重新定義架構(gòu)”
華為被制裁的這幾年,算力產(chǎn)業(yè)其實(shí)也處在變革過程中。
隨著大模型Scaling Law(尺度定律)的持續(xù)演進(jìn),整個(gè)AI行業(yè)產(chǎn)生了巨量算力需求。但是傳統(tǒng)的計(jì)算集群已經(jīng)出現(xiàn)瓶頸,無限制的堆卡并不能帶來算力的線性提升,反而會產(chǎn)生“內(nèi)存墻”、“規(guī)模墻”和“通信墻”的問題。這是因?yàn)樵诩簝?nèi)部,算力卡之間和服務(wù)器之間并不是獨(dú)立工作,而是需要邊計(jì)算邊“溝通”,如果通信能力跟不上,就會出現(xiàn)算力閑置。
過去8年間,單卡硬件算力增長了40倍,但節(jié)點(diǎn)內(nèi)總線帶寬只增長了9倍,跨節(jié)點(diǎn)的網(wǎng)絡(luò)帶寬只增長了4倍,這使得集群網(wǎng)絡(luò)通信成為當(dāng)前大模型訓(xùn)練和推理的最大挑戰(zhàn)。因此如果不能提升通信效率,單純把384張昇騰卡堆起來,計(jì)算效果并不一定就比72張英偉達(dá)卡更好,因?yàn)榭ㄩg和服務(wù)器間的通信開銷會抵消算力增加的收益,導(dǎo)致有效算力不升反降。
作為算力產(chǎn)業(yè)先行者,英偉達(dá)早早意識到這個(gè)問題。黃仁勛的做法是,把之前消費(fèi)級顯卡上的NVLink技術(shù)移植到計(jì)算集群中,相當(dāng)于給GPU之間搭建一條“專用超寬車道”并且把多顆GPU、CPU、高帶寬內(nèi)存、NVLink/NVSwitch等高度集成,打造了NVL72超節(jié)點(diǎn)。
但問題是,NVLink只能用于英偉達(dá)自家GPU之間的通信,節(jié)點(diǎn)內(nèi)的NPU、FPGA等非GPU異構(gòu)硬件,并不能走這條“超寬車道”,還是要通過效率較低的PCIe協(xié)議走CPU中轉(zhuǎn),同時(shí)節(jié)點(diǎn)之間通過以太網(wǎng)/InfiniBand等協(xié)議跨機(jī)互聯(lián),在巨量計(jì)算中也存在帶寬堵點(diǎn)。
不同于這種做法,華為CloudMatrix 384超節(jié)點(diǎn)對計(jì)算架構(gòu)進(jìn)行重構(gòu),徹底打破了傳統(tǒng)以CPU為中心的馮諾依曼架構(gòu),創(chuàng)新提出了“全對等架構(gòu)”。它通過3168根光纖和6912個(gè)400G光模塊構(gòu)建了高速互聯(lián)總線,并把總線從服務(wù)器內(nèi)部擴(kuò)展到整機(jī)柜、甚至跨機(jī)柜,最終將CPU、NPU、DPU、存儲和內(nèi)存等資源全部互聯(lián)和池化,這樣做就能去除掉了繁多的中轉(zhuǎn)環(huán)節(jié),從而實(shí)現(xiàn)真正的點(diǎn)對點(diǎn)互聯(lián),進(jìn)而實(shí)現(xiàn)更大的算力密度和互聯(lián)帶寬。
“西方是繼承發(fā)展,任總形象地比喻為‘百納衣’,就是衣服破了以后不斷地打補(bǔ)丁,協(xié)議不同,互通要轉(zhuǎn)換的,包頭套包頭,有效載荷就很小了。我們重新定義了對等的架構(gòu),統(tǒng)一了所有的通信協(xié)議,互通就不需要轉(zhuǎn)換,提升了有效載荷?!比A為技術(shù)專家對觀察者網(wǎng)說道。
“打鐵還需自身硬,充分滿足國內(nèi)需要”
華為構(gòu)建了這么強(qiáng)大的昇騰算力,實(shí)際應(yīng)用效果怎么樣?尤其是在英偉達(dá)高端算力被封鎖的情況下,昇騰算力到底能不能給中國AI發(fā)展帶來底氣和信心?這是行業(yè)內(nèi)外真正關(guān)心的。
- 責(zé)任編輯: 呂棟 
-
“月薪5000不要吃”的巴奴,要赴港講“品質(zhì)火鍋”的故事
2025-06-25 09:05 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
-
狼爪:一場非典型的“安踏式救贖”
2025-06-24 16:40 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
蘋果官網(wǎng)首次支持國補(bǔ),至高省2000元
2025-06-24 15:10 -
興業(yè)銀行聯(lián)手全國工商聯(lián),民企綠色轉(zhuǎn)型注入金融活水
2025-06-24 14:27 金融觀察 -
何猷君收了王思聰?shù)纳坦芄荆百€王二代”繼續(xù)押注電競產(chǎn)業(yè)
2025-06-24 10:44 電子游戲 -
-
-
-
中國長安汽車集團(tuán)更名為“辰致汽車科技集團(tuán)”
2025-06-23 22:24 -
胖東來將關(guān)閉多家老店,包括半年銷售額8億的“明星門店”
2025-06-23 21:04 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
奈雪茶包驚現(xiàn)干蛙尸體,消費(fèi)者直呼“惡心到終身陰影”
2025-06-23 19:19 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
-
雷軍:小米沒有計(jì)劃造油車
2025-06-23 17:48 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
微信推出新功能:朋友圈評論區(qū)可以發(fā)表情包和圖片了
2025-06-23 17:18 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
淘寶閃購聯(lián)合餓了么日訂單超六千萬
2025-06-23 16:58 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
3年虧損24億,兆芯擬募資超40億研發(fā)新CPU
2025-06-23 16:07 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
“人工智能的入場,正在給中國供應(yīng)鏈帶來更大的優(yōu)勢”
2025-06-23 15:40 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
1元1店!蘇寧易購“白菜價(jià)”甩賣4座家樂福
2025-06-23 14:54 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
相關(guān)推薦 -
最新聞 Hot
-
好一個(gè)“舉賢不避親”,特朗普推薦兒媳參選
-
開庭前妻子墜樓身亡,柯文哲前副手痛哭:臺灣怎么變成這樣
-
美國放風(fēng):伊朗有動作了
-
“中方正考慮邀請李在明出席”
-
“中國洋垃圾禁令震動全球”,馬來西亞也跟了
-
靠萬斯“決勝一票”,“大而美”法案驚險(xiǎn)闖關(guān)參議院
-
白宮官員:沒人在乎馬斯克說了什么
-
日澳印各懷心事,魯比奧還想著中國:別談了,得干實(shí)事,搞礦!
-
三年來首次,普京與馬克龍通話
-
“我會給日本寫信感謝他們,給他們加關(guān)稅”
-
特朗普:奧巴馬糟糕小布什低分,拜登史上最差,而我…
-
美財(cái)長:中國加快稀土出口吧,回到過去
-
“《新華字典》例句稱小孩是累贅”再引爭議,多方回應(yīng)
-
英國樂隊(duì)在音樂節(jié)上高喊“以軍去死”,英美都“炸”了
-
多地宣布“解禁”中華田園犬
-
內(nèi)塔尼亞胡證實(shí)下周訪美,除了特朗普還要見他們
快訊- 暴雨洪澇致有群眾失聯(lián),河南省委書記部署,常務(wù)副省長帶隊(duì)赴現(xiàn)場
- 國臺辦:“為臺澎金馬而戰(zhàn)”?賴清德不惜將無辜民眾綁上“臺獨(dú)”戰(zhàn)車
- 旅客自棄的充電寶如何處理?國際航班要查嗎?上海機(jī)場集團(tuán)回應(yīng)
- 谷歌因?yàn)E用安卓手機(jī)數(shù)據(jù)被判賠22億
- “中方正考慮邀請李在明出席”
- 以“高志凱線”為中印邊界?高志凱回應(yīng)
- 秦始皇遣使采藥昆侖石刻陷爭議,首次提出者回應(yīng)
- 京津冀一周觀察 | 北京昌平救援驢友將追繳費(fèi)用;河北生育津貼直發(fā)給個(gè)人
-