-
英偉達宣布推出最強AI芯片,成本和能耗較前代改善25倍
號稱今年全球頭號人工智能(AI)領(lǐng)域開發(fā)者大會的英偉達2024 GTC AI大會于美東時間3月18日周一拉開帷幕。今年是英偉達時隔五年首次讓年度GTC重回線下,也是此前分析認為英偉達要“拿出點真家伙”的AI盛會。
當(dāng)?shù)貢r間周一下午,英偉達創(chuàng)始人兼CEO黃仁勛在美國加州圣何塞SAP中心進行主題為“面向開發(fā)者的1#AI峰會”(1#AI Conference for Developers)演講。黃仁勛介紹了運行AI模型的新一代芯片和軟件。英偉達正式推出名為Blackwell的新一代AI圖形處理器(GPU),預(yù)計將在今年晚些時候發(fā)貨。
Blackwell平臺能夠在萬億參數(shù)級的大型語言模型(LLM)上構(gòu)建和運行實時生成式AI,而成本和能耗比前身低25倍。
另據(jù)媒體報道,英偉達CEO黃仁勛在GTC宣布,將在其企業(yè)軟件訂閱中增加一款名為NIM的新產(chǎn)品。NIM可以更容易地使用舊的英偉達GPU進行推理,并允許公司繼續(xù)使用他們已經(jīng)擁有的數(shù)億個英偉達GPU。該產(chǎn)品將使新人工智能模型的初始訓(xùn)練推理所需的算力更少。該公司的策略是讓購買英偉達服務(wù)器的客戶注冊英偉達企業(yè)版,每個GPU每年收取費用4500美元。黃仁勛表示,該軟件還將幫助在配備GPU的筆記本電腦上運行人工智能,而不是在云服務(wù)器上運行。
此外,英偉達CEO黃仁勛宣布推出下一代人工智能超級計算機,英偉達還發(fā)布6G研究云平臺,以便用AI技術(shù)推進無線通信。
英偉達推新AI芯片
據(jù)外媒報道,英偉達于周一宣布推出新一代人工智能芯片和用于運行人工智能模型的軟件。該公司在美國圣何塞舉行的開發(fā)者大會上宣布了這一消息,正值這家芯片制造商尋求鞏固其作為人工智能公司首選供應(yīng)商的地位。
自O(shè)penAI的ChatGPT于2022年末掀起人工智能熱潮以來,英偉達的股價上漲了五倍,總銷售額增長了兩倍多。英偉達的高端服務(wù)器GPU對于訓(xùn)練和部署大型AI模型至關(guān)重要。微軟和Meta等公司已經(jīng)花費了數(shù)十億美元購買這些芯片。
來源:視頻截圖
新一代AI圖形處理器命名為Blackwell。首款Blackwell芯片名為GB200,將于今年晚些時候發(fā)貨。英偉達正在用更強大的芯片吸引客戶,以刺激新訂單。例如,各公司和軟件制造商仍在爭相搶購當(dāng)前一代的“Hopper”H100芯片及類似產(chǎn)品。
“Hopper很棒,但我們需要更大的GPU,”英偉達首席執(zhí)行官黃仁勛周一在該公司于加利福尼亞州舉行的開發(fā)者大會上表示。不過,周一盤后交易中,英偉達股價下跌超過1%。該公司還推出了名為NIM的創(chuàng)收軟件,該軟件將簡化AI的部署,為客戶提供了在日益增多的競爭者中堅持使用英偉達芯片的另一個理由。
英偉達高管表示,該公司正從一個唯利是圖的芯片提供商轉(zhuǎn)變?yōu)楦裎④浕蛱O果的平臺提供商,其他公司可以在此基礎(chǔ)上構(gòu)建軟件。
“Blackwell不僅僅是一款芯片,而是一個平臺的名稱,”黃仁勛表示。
英偉達企業(yè)副總裁Manuvir Das在接受采訪時表示:“可銷售的商業(yè)產(chǎn)品是GPU,而軟件則是為了幫助人們以不同的方式使用GPU。當(dāng)然,我們現(xiàn)在仍然這樣做。但真正改變的是,我們現(xiàn)在真的有了商業(yè)軟件業(yè)務(wù)?!?
Das表示,英偉達的新軟件將更容易在任何英偉達GPU上運行程序,甚至是那些可能更適合部署而不是構(gòu)建AI的老舊GPU。“如果你是開發(fā)者,你有一個有趣的模型,你希望人們采用它,如果你把它放入NIM中,我們會確保它可以在我們所有的GPU上運行,這樣你就可以覆蓋很多人,”Das說道。
Blackwell擁有六項革命性技術(shù)
英偉達每兩年更新一次其GPU架構(gòu),實現(xiàn)性能的飛躍。過去一年發(fā)布的許多AI模型都是在該公司的Hopper架構(gòu)上訓(xùn)練的,該架構(gòu)被用于H100等芯片,于2022年宣布推出。
來源:視頻截圖
據(jù)悉,英偉達稱,Blackwell擁有六項革命性的技術(shù),可以支持多達10萬億參數(shù)的模型進行AI訓(xùn)練和實時LLM推理:
全球最強大的芯片:Blackwell架構(gòu)GPU由2080億個晶體管組成,采用量身定制的臺積電4納米工藝制造,兩個reticle極限GPU裸片將10 TB/秒的芯片到芯片鏈路連接成單個統(tǒng)一的GPU。
第二代Transformer引擎:結(jié)合了Blackwell Tensor Core技術(shù)和TensorRT-LLM和NeMo Megatron框架中的英偉達先進動態(tài)范圍管理算法,Blackwell將通過新的4位浮點AI支持雙倍的計算和模型大小推理能力。
第五代NVLink:為提高數(shù)萬億參數(shù)和混合專家AI模型的性能,最新一代英偉達NVLink為每個GPU提供了突破性的1.8TB/s雙向吞吐量,確保最復(fù)雜LLM之間多達576個GPU之間的無縫高速通信。
RAS引擎:Blackwell支持的GPU包含一個專用引擎,實現(xiàn)可靠性、可用性和服務(wù)性。此外,Blackwell架構(gòu)還增加了芯片級功能,利用基于AI的預(yù)防性維護進行診斷和預(yù)測可靠性問題。這可以最大限度地延長系統(tǒng)正常運行時間,并提高大部署規(guī)模AI的彈性,使其能連續(xù)運行數(shù)周甚至數(shù)月,并降低運營成本。
安全人工智能:先進的機密計算功能可在不影響性能的情況下保護AI模型和客戶數(shù)據(jù),并支持新的本機接口加密協(xié)議,這對于醫(yī)療保健和金融服務(wù)等隱私敏感行業(yè)至關(guān)重要。
解壓縮引擎:專用解壓縮引擎支持最新格式,加快數(shù)據(jù)庫查詢,提供數(shù)據(jù)分析和數(shù)據(jù)科學(xué)的最高性能。未來幾年,在企業(yè)每年花費數(shù)百億美元的數(shù)據(jù)處理方面,將越來越多地由GPU加速。
來源:視頻截圖
Blackwell GPU體積龐大,將兩個單獨制造的晶粒組合成一個由臺積電制造的芯片。它還將作為一款名為GB200 NVLink 2的整個服務(wù)器提供,該服務(wù)器結(jié)合了72個Blackwell GPU和其他旨在訓(xùn)練AI模型的英偉達部件。
亞馬遜、谷歌、微軟和甲骨文將通過云服務(wù)提供對GB200的訪問。GB200將兩個B200 Blackwell GPU與一個基于Arm的Grace CPU配對。英偉達表示,亞馬遜網(wǎng)絡(luò)服務(wù)將構(gòu)建一個包含20000個GB200芯片的服務(wù)器集群。
英偉達沒有提供新款GB200或其使用系統(tǒng)的成本。據(jù)分析師估計,英偉達基于Hopper的H100芯片成本在2.5萬至4萬美元之間,而整個系統(tǒng)的成本高達20萬美元。
英偉達推理微服務(wù)
英偉達還宣布,將在其英偉達企業(yè)軟件訂閱中添加一款名為NIM(英偉達推理微服務(wù))的新產(chǎn)品。NIM讓使用較舊的英偉達GPU進行推理(或運行AI軟件的過程)變得更加簡單,并允許公司繼續(xù)使用其已經(jīng)擁有的數(shù)億個英偉達GPU。與新AI模型的初始訓(xùn)練相比,推理所需的計算能力較少。對于那些希望運行自己的AI模型,而不是從OpenAI等公司購買AI結(jié)果作為服務(wù)的企業(yè)來說,NIM無疑是他們的得力助手。
英偉達的策略是吸引購買基于英偉達的服務(wù)器的客戶注冊英偉達企業(yè)版,每個GPU每年的許可費為4500美元。
英偉達將與微軟或Hugging Face等AI公司合作,確保他們的AI模型能夠在所有兼容的英偉達芯片上運行。隨后,開發(fā)者可以使用NIM在自有服務(wù)器或基于云端的英偉達服務(wù)器上高效運行模型,無需繁瑣的配置過程。
“在我原本調(diào)用OpenAI的代碼中,我只需替換一行代碼,將其指向從英偉達獲取的NIM即可。”Das說道。
英偉達表示,該軟件還將助力AI在配備GPU的筆記本電腦上運行,而非僅限于云端服務(wù)器。
- 原標(biāo)題:重磅!“我們需要更大的GPU”,英偉達宣布推出最強AI芯片,成本和能耗較前代改善25倍
- 責(zé)任編輯: 林鈴錦 
-
閱文去年歸母凈利增長32%,展望2024為“爆款之年”
2024-03-18 18:00 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
獨家:盒馬CEO侯毅正式退休
2024-03-18 16:47 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
谷歌再次誤報林吉特匯率數(shù)據(jù),馬來西亞央行:請解釋!
2024-03-18 14:13 -
歐洲要搶在美國前面降息了?
2024-03-18 11:29 -
首次!簽“陰陽合同”被明確列舉為逃稅
2024-03-18 10:46 依法治國 -
前2月新建商品房銷售額降29.3%,其中住宅降32.7%
2024-03-18 10:21 觀網(wǎng)財經(jīng)-房產(chǎn) -
前2月社零總額增長5.5%,其中餐飲增長12.5%
2024-03-18 10:09 觀網(wǎng)財經(jīng)-消費 -
中糧300億收購盒馬大潤發(fā)?官方回應(yīng):假的
2024-03-17 16:57 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
福耀玻璃六成凈利用于分紅 北向資金去年加倉1.1億股
2024-03-17 09:59 -
波音要求航司檢查787駕駛艙座椅:可能導(dǎo)致飛機快速墜落
2024-03-16 17:27 大公司 -
北京警方:已對“中植系”所屬財富公司主要涉案嫌疑人采取強制措施
2024-03-16 15:50 觀網(wǎng)財經(jīng)-金融 -
一周內(nèi),多家上市公司實控人被留置
2024-03-16 07:24 觀網(wǎng)財經(jīng)-金融 -
淋巴、腺體肉眼做梅菜扣肉預(yù)制菜,生產(chǎn)場景觸目驚心…
2024-03-15 20:40 食品安全 -
3·15晚會:個別企業(yè)用普通鋼化玻璃打上防火標(biāo),冒充防火玻璃進行銷售
2024-03-15 20:21 315維權(quán) -
中國電視霸主的雄心與遠見
2024-03-15 17:06 -
央行:前兩個月社融增加8.06萬億元,2月底規(guī)模存量385.72萬億元
2024-03-15 16:51 宏觀經(jīng)濟 -
爭議“僅退款”:錢退了,假貨有人管嗎?
2024-03-15 16:50 觀網(wǎng)財經(jīng)-消費 -
央行:2月末M2余額299.56萬億元,同比增長8.7%
2024-03-15 16:43 -
證監(jiān)會:對分紅采取強約束措施,推動一年多次分紅
2024-03-15 15:34 股市 -
中央決定:簡勤任中國聯(lián)通總經(jīng)理
2024-03-15 15:06 國企備忘錄
相關(guān)推薦 -
“美國已解除這項對華出口禁令” 評論 210“不如申請成中國一省” ,德國鋰企竟如此激將歐盟 評論 125最新聞 Hot
-
“美國已解除這項對華出口禁令”
-
“印軍將全面排查中國產(chǎn)零部件”
-
美國和盟友鬧掰?“本質(zhì)沒變,中國需高度警惕”
-
斯塔默不吱聲,英財相當(dāng)場落淚,“哭崩”市場
-
家樂福CEO放話:對中國小包裹,要學(xué)特朗普征稅100%
-
莫迪表態(tài):金磚是重要平臺
-
“還想阻撓大陸武統(tǒng)?美國太晚了”
-
受賄數(shù)額特別巨大,齊同生被提起公訴
-
“美國占一半,中國分四成,歐洲...”
-
李在明最新涉華表態(tài)
-
叫完“爸爸”又被白宮整活,北約秘書長:驚喜且有趣
-
私自留存涉密材料,宋立強被開黨籍
-
印度外長在美表態(tài):要這么對中國
-
中國緊盯貿(mào)易協(xié)議,“若誰聯(lián)美抗中,必遭反制”
-
“美國人自豪感急劇下降,特別是民主黨人”
-
“富士康要求中國員工從印度撤離”
-