-
中國工程院院士高文:什么時候中國算力超越美國,GDP也就有望超越美國了
-
呂棟lvdong@guancha.cn
最后更新: 2023-07-09 10:49:38各位專家、各位領(lǐng)導(dǎo),大家下午好!
前面的領(lǐng)導(dǎo)都講的很好,算力是非常重要的一件事,今天上午陳書記也講到,上海要抓三件大事,人工智能領(lǐng)域,算力建設(shè)是非常重要的一方面,就像電力一樣,原來李克強總理抓經(jīng)濟的時候,有一個很重要的指數(shù)就是“克強指數(shù)”,是靠電力消耗看整個經(jīng)濟發(fā)展順不順利,或者是正常不正常。
從現(xiàn)在開始,算力也是數(shù)字經(jīng)濟發(fā)展的一個指數(shù)。算力夠,數(shù)字經(jīng)濟就能發(fā)展好,不夠就發(fā)展不好。所以,算力建設(shè)尤其是智能算力建設(shè)就非常關(guān)鍵。我在這里,跟大家分享關(guān)于鵬城云腦的智算平臺,另外是分享一下,在這個平臺上做的鵬城腦海大模型。
首先算力很重要,但重要到什么程度呢?清華大學(xué)一個2022年的咨詢報告提到,經(jīng)過統(tǒng)計,算力指數(shù)和GDP是正相關(guān)的,一個國家算力越強,GDP就越強。美國現(xiàn)在算力指數(shù)排第一,比我們大概多了20%-30%的算力,GDP也比我們多20%-30%,什么時候我們的算力超越美國,咱們的GDP也就有望超越美國了。
正是因為算力這么重要,所以發(fā)展人工智能和數(shù)字經(jīng)濟,沒有匹配的算力是不可能的。要有算力,就要有芯片,芯片做成機器,才能用這個機器訓(xùn)練模型。
為了做這件事,我們2020年在深圳做了一臺機器叫鵬城云腦Ⅱ。在2020年,這臺機器的算力是全世界做人工智能訓(xùn)練最強的,比當時微軟、谷歌的機器都要強,相當于4000塊英偉達A100 GPU的算力,而且這臺機器是用全光網(wǎng)絡(luò)連接的,節(jié)點之間延遲非常低。
因為有了這臺機器,我們就可以做很多事,包括做科學(xué)研究、產(chǎn)業(yè)應(yīng)用還有關(guān)鍵技術(shù)的研發(fā)。這臺機器剛剛我說有4000塊卡,其中一方面是鯤鵬CPU,另外是昇騰NPU,都是華為的。
圖源:觀察者網(wǎng)
那么這臺機器的性能行不行呢?我們就參加世界TOP500的超算打榜,整個超算打榜也有其他的賽道,我們參加的是IO500的賽道,是一條考驗輸出和輸入能力的賽道,從2020年10月份這臺機器做出來以后,我們11月份就參加打榜,連續(xù)6次第一,每半年有一次打榜,全節(jié)點連續(xù)兩次第一。
所以做人工智能訓(xùn)練這件事,別人沒辦法和這臺機器比。這臺機器不僅硬件強,接口能力和網(wǎng)絡(luò)也非常強,同時上面的軟件也配備得比較完備,包括怎么樣做分布式計算,怎么樣做命令調(diào)優(yōu)、自研調(diào)度規(guī)劃等等。
也許有的專家聽到過,有人說全世界能在1000塊卡上同時訓(xùn)練一個模型的只有幾千人,能在4000塊卡上訓(xùn)練的不超過100個人,在10000塊卡上訓(xùn)練模型的人數(shù)更少了。在大規(guī)模的卡上一起做事,對于軟件規(guī)劃、資源調(diào)度挑戰(zhàn)非常大。
我們不僅是把鵬城云腦Ⅱ用好,同時也承擔(dān)了國家發(fā)改委的任務(wù),把華為生態(tài)包括昇騰AI集群的算力,不論是100P或900P的算力結(jié)點,用網(wǎng)絡(luò)把資源連起來,可以向外界提供。同時按照發(fā)改委的要求,希望這是異構(gòu)的算力網(wǎng)平臺,我們在華為生態(tài)以外,也選擇了部分其他廠商的算力,在2022年6月這個項目驗收的時候,已經(jīng)聚合的智能算力達到2300P,鵬城云腦Ⅱ只是1000P,而這個系統(tǒng)已經(jīng)聚集了2300P的智能算力。
有了鵬城云腦Ⅱ可以訓(xùn)練大模型了,但訓(xùn)練大模型還是很費算力的,即使可以訓(xùn)練大模型,現(xiàn)在的算力供給根本不夠用,因此我們正在規(guī)劃做鵬城云腦Ⅲ。
下面我說說大模型。
鵬城實驗室正在做一個2000億參數(shù)的大模型,也就是200B的參數(shù),為什么做這件事呢?因為有ChatGPT和類ChatGPT大模型在不停涌現(xiàn),同時現(xiàn)在很多公司都用這個東西做產(chǎn)業(yè)應(yīng)用,去做服務(wù)。所以現(xiàn)在模型變得很重要了,但現(xiàn)在有錢的公司可以砸?guī)讉€億做這樣的機器,甚至十幾個億和幾十個億,而大多數(shù)公司是做不了的。
圖源:觀察者網(wǎng)
這個領(lǐng)域需求這么大,怎么辦?鵬城實驗室可以做一個底座,把模型訓(xùn)練完開放出去,大家在這個底座上做垂直應(yīng)用。按照這樣的思路,我們首先有鵬城云腦Ⅱ的算力,前一階段我們積累了很多數(shù)據(jù),這一段時間我們通過各個渠道,包括購買,拿到數(shù)據(jù)先做清洗,清洗數(shù)據(jù)的工作很重,可能拿到100個數(shù)據(jù),清洗完就剩幾個了,因為有很多是重復(fù)和不規(guī)范的數(shù)據(jù),這些東西拿掉后,數(shù)據(jù)量就變得很小。雖然拿了很多數(shù)據(jù),但是真正用來做訓(xùn)練的數(shù)據(jù)只有1%-5%。有了這些數(shù)據(jù),我們就可以做大模型底座。
這個大模型底座用的就是生成式預(yù)訓(xùn)練模型,也就是和GPT完全類似的底層?,F(xiàn)在這個2000億參數(shù)規(guī)模的大模型訓(xùn)練出來以后,我們希望把它給到合作伙伴那里,而且提供相應(yīng)的指令微調(diào)和相應(yīng)的人工增強學(xué)習(xí)的工具,甚至在一兩個垂直領(lǐng)域作為垂直應(yīng)用樣板。因為華為在這方面很有經(jīng)驗,我們建議誰想做垂直應(yīng)用,可以找華為獲得一些咨詢。
我們希望能快速把這個模型做完推向社會,讓業(yè)界在這個模型上,開發(fā)中國自己的人工智能大模型應(yīng)用系統(tǒng)?,F(xiàn)在我們正在緊鑼密鼓地往前推,應(yīng)該是8月底第一次訓(xùn)練就完成了,9月份就會把模型開放出去。
現(xiàn)在訓(xùn)練的數(shù)據(jù)有多大呢?我們說的是喂數(shù)據(jù),每天喂10個B,但是最重要的是喂一個T的數(shù)據(jù),而一個T是由幾百個T清洗來的,現(xiàn)在數(shù)據(jù)都是中文和代碼數(shù)據(jù),4000多塊卡的機器每天可以吃掉10個B,100天就能吃掉1000個B,也就是一個T,因此訓(xùn)練2000億參數(shù)的模型,需要4000塊卡訓(xùn)練100天。
這就是算力的重要性,如果算力不足的話,做一個模型還是很辛苦的,而且現(xiàn)在這個模型才訓(xùn)練一個T的數(shù)據(jù),如果訓(xùn)練兩到三個T的話,還要加兩到三個100天,沒有大算力做大模型就是天方夜譚。實際上這就和電力是一樣的,想靠省電做出什么產(chǎn)品來,真正懂行的人聽了都不信,一定要有算力作為基礎(chǔ)。
圖源:觀察者網(wǎng)
怎么樣把數(shù)據(jù)做好、訓(xùn)練的快,我們有一套體系。
有個開源社區(qū)叫啟智開源社區(qū),這里有很多工程師在做飛輪數(shù)據(jù)工程,可以使清洗數(shù)據(jù)做得非??欤泻芏嘧詣雍桶胱詣拥那逑磾?shù)據(jù)。同時我們要考慮應(yīng)用的時候有隱私數(shù)據(jù),有一些數(shù)據(jù)應(yīng)用者,希望到這個模型應(yīng)用一下,但是不希望自己的數(shù)據(jù)被丟掉或者是被看到,我們也提供了隱私數(shù)據(jù)保護的模塊。
我們希望鵬城腦海大模型訓(xùn)練出來以后,可以快速向社會賦能,可以讓大家做數(shù)字政府、一帶一路、智能制造、智慧金融、智慧醫(yī)療等各種各樣的應(yīng)用。而且我們還有完整的教育計劃、人才計劃,希望通過高校和合作伙伴培養(yǎng)更多AI人才,能讓中國的大模型應(yīng)用快速啟動。
總結(jié)一下,鵬城實驗室在鵬城云腦Ⅱ硬件平臺和鵬城腦海大模型這兩件事上,都在和華為合作往前推進,希望可以對中國人工智能大模型的應(yīng)用貢獻一點力量。作為一個基石,希望大家多關(guān)心、多參與。
本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 呂棟 
-
“法國人殖民了我們132年,現(xiàn)在該輪到我們殖民他們了”
2023-07-08 15:00 法國見聞 -
-
華為盤古大模型3.0,“沒時間作詩”
2023-07-07 17:35 觀網(wǎng)財經(jīng)-科創(chuàng) -
這家IPO公司主營豬飼料,一年收入超百億
2023-07-07 17:33 觀網(wǎng)財經(jīng)-金融 -
泰國努力吸引中國游客:上半年接待140萬人次,僅為2019年同期1/4
2023-07-07 14:28 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
歐盟加塞烏克蘭議程,“被拉美國家刪光了...”
2023-07-07 14:11 烏克蘭之殤 -
李強主持召開經(jīng)濟形勢專家座談會
2023-07-06 19:54 觀網(wǎng)財經(jīng)-宏觀 -
唱空中國銀行股?高盛回應(yīng)
2023-07-06 18:25 觀網(wǎng)財經(jīng)-金融 -
美國就業(yè)一片大好?美聯(lián)儲暗示數(shù)據(jù)失真
2023-07-06 18:11 觀網(wǎng)財經(jīng)-宏觀 -
光刻機巨頭:沒有向中國市場推出特別版光刻機
2023-07-06 17:05 觀網(wǎng)財經(jīng)-科創(chuàng) -
廈門國際投資擬港股上市:在港澳均有銀行,凈利潤同比下降34.55%
2023-07-06 16:51 觀網(wǎng)財經(jīng)-金融 -
馬云現(xiàn)身巴基斯坦,下一站是這個國家
2023-07-06 15:48 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
斷開社交媒體?馬克龍這個提議激起軒然大波
2023-07-06 10:24 法國見聞 -
他看到了中國市場的紅利,卻忽視了對中國市場的尊重
2023-07-05 18:57 觀網(wǎng)財經(jīng)-科創(chuàng) -
國有銀行將向城投發(fā)放25年期貸款?或為不實消息
2023-07-05 17:59 觀網(wǎng)財經(jīng)-金融 -
鋰電池企業(yè)瑞浦蘭鈞IPO:毛利率遠低于寧德時代,近三年皆虧損
2023-07-05 17:00 觀網(wǎng)財經(jīng)-金融 -
多家銀行下調(diào)美元存款利率,有何影響?
2023-07-05 15:58 觀網(wǎng)財經(jīng)-金融 -
小米再對華為專利提無效宣告請求
2023-07-04 20:59 觀網(wǎng)財經(jīng)-科創(chuàng) -
專利戰(zhàn):OPPO與諾基亞隔空互嗆
2023-07-04 17:53 觀網(wǎng)財經(jīng)-科創(chuàng) -
?中國管制關(guān)鍵金屬鎵、鍺出口,美國半導(dǎo)體公司已著手申請
2023-07-04 17:51 觀網(wǎng)財經(jīng)-評論
相關(guān)推薦 -
-
最新聞 Hot
-
“聽到東方驚雷了嗎?那是14億中國人在笑話美國”
-
“以色列和俄羅斯正進行秘密會談”
-
“不同于西方,中國正建設(shè)由技術(shù)驅(qū)動的福利模式”
-
中國駐泰國大使館:被騙至緬甸的男模特已獲救
-
“越南在走鋼絲,稍有不慎,就會惹惱中國”
-
最新民調(diào):4成支持馬斯克成立新政黨
-
美伊下周在挪威談?
-
“俄美有興趣共同實施經(jīng)濟領(lǐng)域一些‘有前景的項目’,特別是能源”
-
人才引進被舉報中止1年后,再招考入圍名單與此前一致?包頭通報
-
特朗普威脅:周五,接關(guān)稅吧
-
“歐洲領(lǐng)導(dǎo)人向我求助,我提了建議”
-
“我簽署時候,B-2、F-22將從頭頂飛過”
-
天文學(xué)家發(fā)現(xiàn)第三個進入太陽系的“星際訪客”
-
馮德萊恩承認:來不及談成,退而求其次…
-
特朗普簽署行政令:外國游客得加錢
-
美國解除對華C919發(fā)動機出口禁令
-