-
重磅!谷歌推出其最先進AI模型Gemini,大規(guī)模多任務語言理解或超越人類專家
最后更新: 2023-12-07 11:07:23OpenAI空前崛起之際,谷歌毅然打響了絕地反擊戰(zhàn)。
當?shù)貢r間12月6日,谷歌公司宣布推出其規(guī)模最大、功能最強大的新大型語言模型Gemini,其最強大的TPU(張量處理單元)系統(tǒng)“Cloud TPU v5p”以及來自谷歌云的人工智能超級計算機。v5p是今年早些時候全面推出的Cloud TPU v5e的更新版本,谷歌承諾其速度明顯快于v4 TPU。
值得一提的是在MMLU(大規(guī)模多任務語言理解)測試中,Gemini Ultra以90.0%的高分,首次超過了人類專家。
Gemini的各種能力
據界面新聞12月7日報道,Gemini 1.0是谷歌籌備了一年之久的GPT4真正競品,也是目前谷歌能拿出手的功能最為強悍、適配最為靈活的大模型,包括三種不同套件,分別是Gemini Ultra,Gemini Pro和Gemini Nano。
其中Ultra的能力最強,復雜度最高,能夠處理最為困難的多模態(tài)任務;Pro能力稍弱,是一個可擴展至多任務的模型;Nano則是一款可以在手機端側運行的模型。這說明,Gemini的觸達范圍很廣,可以下探至數(shù)據中心,也可以上行至移動設備端側。
Gemini模型經過海量數(shù)據訓練,可以很好識別和理解文本、圖像、音頻等內容,并可以回答復雜主題相關的問題。所以,非常擅長解釋數(shù)學和物理等復雜學科的推理任務。
Gemini可以生成和理解Python、Java、C++和Go等主流代碼。Gemini Ultra在多個編碼基準測試中表現(xiàn)出色,包括HumanEval,這是評估編碼任務性能的重要行業(yè)標準。
谷歌還基于Gemini模型開發(fā)了專業(yè)的代碼模型AlphaCode 2。與前一代相比,AlphaCode 2的性能提升了至少50%以上。
Gemini的多模態(tài)功能,使其能在視覺理解、文本生成等方面有非常強的功能。例如,從數(shù)十萬字的小說中整理出重要觀點,從200頁的金融報告中找出最有價值的內容。這對于金融、科技、醫(yī)療的科研和業(yè)務人員來說幫助巨大。
在一段公布的演示視頻中,桑達爾?皮查伊展示了Gemini對視頻、圖像的非同凡響的識別能力。在視頻中,Gemini極為自如地在圖像、音頻、視頻各模態(tài)之間的轉換,展現(xiàn)了驚人的解鎖應用場景與產品形態(tài)的潛力。
圖片來源:谷歌演示視頻
僅從谷歌釋出的演示視頻結果看,市面上現(xiàn)有的全部多模態(tài)大模型與Gemini的性能表現(xiàn)都有代際差,包括Meta 5月開源的跨6個模態(tài)的AI模型ImageBind以及GPT-4。
圖片來源:谷歌
一年前,在人工智能開發(fā)機構OpenAI發(fā)布聊天機器人ChatGPT后,創(chuàng)造了當前人工智能熱潮背后大部分基礎技術的谷歌措手不及,一度發(fā)布了內部“紅色警報”(red code)。一年零一周后,谷歌似乎準備好了反擊。
據澎湃新聞,谷歌DeepMind首席執(zhí)行官、Gemini團隊代表德米斯·哈薩比斯(Demis Hassabis)在發(fā)布會上正面談及GPT-4與Gemini的對比,“我們對系統(tǒng)進行了非常徹底的分析,并進行了基準測試。谷歌運行了32個完善的基準測試來比較這兩個模型,從廣泛的整體測試(如多任務語言理解基準測試)到比較兩個模型生成Python代碼的能力?!惫_比斯略帶微笑地表示,“我認為我們在32項基準中的30項中大幅領先?!?
從發(fā)布日起,Gemini可開始應用于Bard和Pixel 8 Pro智能手機,并將很快與谷歌服務中的其他產品集成,包括Chrome、搜索和廣告等。
目前,谷歌計劃通過谷歌云將Gemini授權給客戶,供他們在自己的應用程序中使用。12月13日開始,開發(fā)者和企業(yè)客戶可以通過谷歌AI Studio或谷歌Cloud Vertex AI中的Gemini API(應用程序編程接口)訪問Gemini Pro,安卓開發(fā)人員可以使用Gemini Nano完成構建。
據介紹,Gemini Ultra是第一個在MMLU(大規(guī)模多任務語言理解)方面超越人類專家的模型,該模型綜合使用數(shù)學、物理、歷史、法律、醫(yī)學和倫理學等57個科目來測試世界知識和解決問題的能力,谷歌在一篇博客文章中表示,它可以理解復雜主題中的細微差別和推理。
而據CNBC報道,谷歌高管們在新聞發(fā)布會上表示Gemini Pro的表現(xiàn)優(yōu)于GPT-3.5,但回避了與GPT-4相比如何的問題。對于谷歌是否計劃對Bard Advanced的訪問收費,Bard總經理蕭茜茜(Sissie Hsiao)表示,谷歌專注于創(chuàng)造良好的體驗,目前還沒有任何相關盈利的細節(jié)。
谷歌最強TPU與AI超級計算機
與新模型一起亮相的,還有新版本的TPU芯片TPU v5p,旨在減少訓練大語言模型相關的時間投入。TPU是谷歌為神經網絡設計的專用芯片,經過優(yōu)化可加快機器學習模型的訓練和推斷速度,谷歌于2016年起開始推出第一代TPU。
據谷歌介紹,與TPU v4相比,TPU v5p的浮點運算性能提升了兩倍,在高帶寬內存方面提高了3倍。使用谷歌的600 GB/s芯片間互連,可以將8960個v5p加速器耦合在一個Pod(通常指一個包含多個芯片的集群或模塊)中,從而更快或更高精度地訓練模型。作為參考,該值比TPU v5e大35倍,是TPU v4的兩倍多。
谷歌稱,TPU v5p是其迄今為止最強大的,能夠提供459 teraFLOPS(每秒可執(zhí)行459萬億次浮點運算)的bfloat16(16位浮點數(shù)格式)性能或918 teraOPS(每秒可執(zhí)行918萬億次整數(shù)運算)的Int8(執(zhí)行8位整數(shù))性能,支持95GB的高帶寬內存,能夠以2.76 TB/s的速度傳輸數(shù)據。
谷歌表示,所有這些意味著TPU v5p可以比TPU v4更快地訓練大型語言模型,如訓練GPT-3(1750億參數(shù))這樣的大語言模型速度比TPU v4快2.8倍。
除了新硬件之外,谷歌還引入了“人工智能超級計算機”的概念。谷歌云將其描述為一種超級計算架構,包括一個集成系統(tǒng),具有開放軟件、性能優(yōu)化硬件、機器學習框架和靈活的消費模型。
谷歌計算和機器學習基礎設施部門副總裁馬克·洛邁爾(Mark Lohmeyer)在博客文章中解釋道,“傳統(tǒng)方法通常通過零碎的組件級增強來解決要求苛刻的人工智能工作負載,這可能會導致效率低下和瓶頸?!薄跋啾戎?,人工智能超級計算機采用系統(tǒng)級協(xié)同設計來提高人工智能訓練、調整和服務的效率和生產力?!边@可以理解為,與單獨看待每個部分相比,這種合并將提高生產力和效率。換句話說,超級計算機是一個系統(tǒng),其中任何可能導致性能低下的變量(硬件或軟件)都受到控制和優(yōu)化。
(作者 杜宇)
- 原標題:重磅!谷歌推出其最先進AI模型Gemini,大規(guī)模多任務語言理解或超越人類專家
- 責任編輯: 唐曉甫 
-
又一國之重器!世界最深、最大的極深地下實驗室投入科學運行
2023-12-07 07:17 科技前沿 -
“正與美國政府合作,確保中國特供芯片出口”
2023-12-06 17:51 中美關系 -
我國首次海上遠距離機動發(fā)射,捷龍三號有哪些新突破?
2023-12-06 15:12 -
新一代國產超算系統(tǒng)“天河星逸”發(fā)布
2023-12-06 13:19 科技前沿 -
全球首座第四代核電站在山東投產
2023-12-06 10:21 科技前沿 -
AI僅用17天獨自創(chuàng)建41種新材料,速度和精確性遠超人類
2023-12-04 09:06 人工智能 -
新突破!重慶大學研究團隊將電鏡顯微技術從二維推進至三維
2023-12-02 18:29 科技前沿 -
“雪龍”號抵達南極中山站
2023-12-01 16:06 南極探險 -
首個國家級海上風電研究與試驗檢測基地開建
2023-12-01 15:39 -
有望成為新型半導體材料!中國科學家合成全新碳分子
2023-12-01 09:33 科技前沿 -
英偉達CEO:中國特供芯片,合規(guī)就開賣
2023-11-30 11:16 -
0.1微米!超精密加工利器來了
2023-11-30 08:15 中國精造 -
打造世界一流科技期刊,中國底氣在哪里?
2023-11-29 14:00 -
中國載人航天工程辦公室:盼港澳航天員進駐祖國空間站
2023-11-29 10:19 航空航天 -
中國空間站第一組全構型工作照發(fā)布
2023-11-28 16:58 航空航天 -
中國首顆高精度地磁場探測衛(wèi)星投入使用
2023-11-28 15:02 航空航天 -
朝中社:朝鮮加快“萬里鏡-1”號偵察衛(wèi)星微調進程
2023-11-27 18:54 朝鮮現(xiàn)狀 -
如果未來20年“機器人女友”成為現(xiàn)實,人類能收獲AI愛情嗎?
2023-11-27 17:41 -
高林:發(fā)展人工智能應堅持“智能向善”
2023-11-27 15:03 人工智能 -
劉伯超:真誠希望中美雙方深化人工智能技術交流與合作
2023-11-27 15:03 人工智能
相關推薦 -
“2027年起,整個產業(yè)將拱手讓給中國” 評論 18“不如申請成中國一省” ,德國鋰企竟如此激將歐盟 評論 73美國放風:伊朗有動作了 評論 86靠萬斯“決勝一票”,“大而美”法案驚險闖關參議院 評論 184最新聞 Hot
-
特朗普參觀“鱷魚惡魔島”:拜登就想把我關在這兒,這XX養(yǎng)的
-
公安部通報:陳某為吸粉引流編造“工行假金條”,已被依法追責
-
“2027年起,整個產業(yè)將拱手讓給中國”
-
特朗普威脅:敢礙事,就逮捕你
-
“7年前就發(fā)現(xiàn)問題了,一直沒修”
-
“不如申請成中國一省” ,德國鋰企竟如此激將歐盟
-
終于換了,特朗普:我很滿意
-
要跟中國對著干?“剛果(金),別斷送發(fā)展機遇”
-
美兩員“大將”施壓未果,日本反倒成了“難啃的骨頭”
-
白宮找補:美國很強,不信去問伊朗
-
何君堯:建議給皇后大道、維多利亞公園改名
-
“美國自毀長城,中企憑高性價比一路高歌猛進”
-
兩國矛盾激化,阿媒突然發(fā)文:收到匿名材料,是俄軍擊中的
-
裝不裝空調,法國政客都能吵起來
-
潛入醫(yī)院裝電詐設備,騙走30萬!今年已發(fā)生多起
-
美報告炒作:中企占比近10%,“五角大樓供應鏈極其脆弱”
-