-
訊飛星火之后,螞蟻用國產(chǎn)芯片訓練出2900億參數(shù)大模型
最后更新: 2025-03-24 18:53:073月24日,彭博社援引知情人士消息稱,螞蟻集團已成功利用阿里巴巴、華為等國產(chǎn)芯片,結合混合專家(MoE)架構訓練出參數(shù)規(guī)模達2900億的大模型“Ling-Plus”,其性能與英偉達H800芯片訓練的同類模型相當,且訓練成本降低20%。這一突破是繼科大訊飛“星火大模型”之后,中國國產(chǎn)算力生態(tài)即將迎來的第二個標志性大模型。
據(jù)螞蟻集團Ling團隊發(fā)布的論文,其自研的Ling系列模型通使用國產(chǎn)廠商(如壁仞科技、天數(shù)智芯、寒武紀等)的產(chǎn)品,訓練1萬億Token的成本從635萬元降至508萬元,降幅達20%,但模型性能仍可對標阿里通義Qwen2.5-72B和DeepSeek-V2.5。
針對外媒(彭博社)關于螞蟻百靈大模型訓練成本的報道,螞蟻方面回應觀察者網(wǎng)稱:螞蟻針對不同芯片持續(xù)調優(yōu),以降低AI應用成本,目前取得了一定的進展,也會逐步通過開源分享。
除了自研性能領先的大模型以外,該技術論文最大的突破在于提出了一系列創(chuàng)新方法,以提升資源受限環(huán)境下AI開發(fā)的效率與可及性。實驗表明,其3000億參數(shù)的MoE大模型可在使用國產(chǎn)GPU的低性能設備上完成高效訓練,性能與完全使用英偉達芯片、同規(guī)模的稠密模型及MoE模型相當。作為國內較早布局AI大模型的廠商,螞蟻自研的百靈大模型2023年已通過備案,重點布局在生活服務、金融服務、醫(yī)療健康等場景的應用。
在此之前,科大訊飛發(fā)布了首個基于全國產(chǎn)化算力平臺訓練的全民開放大模型——訊飛星火V3.5。
本月,科大訊飛與華為聯(lián)合團隊宣布,成功在昇騰國產(chǎn)算力集群上實現(xiàn)MoE模型的大規(guī)??绻?jié)點專家并行推理。這是繼深度求索(DeepSeek)公開MoE訓練方案后,業(yè)界首個完全基于國產(chǎn)算力的解決方案。
通過算子融合、混合并行策略和通信計算并行優(yōu)化等一系列創(chuàng)新,科大訊飛在國產(chǎn)算力上實現(xiàn)了顯著性能提升:單卡靜態(tài)內存占用縮減至雙機部署的1/4,效率提升75%,專家計算密度增加4倍,推理吞吐提升3.2倍,端到端時延降低50%。
基于此次科大訊飛攜手華為所做的首個基于國產(chǎn)算力的MoE模型訓推方案,科大訊飛稱,這一突破性的解決方案也將應用于訊飛星火深度推理模型的訓練加速,預期訓練時推理效率將提升200%。同時,基于該方案的推理引擎也實現(xiàn)了國產(chǎn)算力上DeepSeek-V3和R1的高效推理。
科大訊飛“星火”驗證了國產(chǎn)算力的可行性,螞蟻“Ling系列”則進一步證明其規(guī)模化和經(jīng)濟性。隨著阿里、華為等巨頭加碼,中國AI產(chǎn)業(yè)正從“單點突破”轉向“生態(tài)協(xié)同”。這場算力平權運動,或將成為全球AI競賽的新變量。
本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權,不得轉載。
- 責任編輯: 楊依婷 
-
京東外賣上線40天,日訂單首破百萬
2025-03-24 18:12 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
宣布斥資15億布局香港后,京東要把家電價格打到全港最低
2025-03-24 18:12 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
2元的一根妙可藍多奶酪,去年又掙了1.13億
2025-03-24 17:34 觀網(wǎng)財經(jīng)-消費 -
直擊F1中國大獎賽:空中云匯助力邁凱倫車隊實現(xiàn)“零時差支付”
2025-03-24 17:30 今日財經(jīng) -
途虎養(yǎng)車全網(wǎng)首發(fā)德國馬牌ExtremeContact XC7全新輪胎產(chǎn)品線
2025-03-24 17:26 -
控量挺價成效待考,舍得酒業(yè)2024年凈利驟降80%
2025-03-24 17:25 觀網(wǎng)財經(jīng)-消費 -
教培跑路頻發(fā),美團這招行不行?
2025-03-24 17:24 觀網(wǎng)財經(jīng)-消費 -
2024年中國財政政策執(zhí)行情況報告發(fā)布
2025-03-24 16:23 -
TCL實業(yè)盧春水:掌握上游技術,才是全球競爭的核心驅動力
2025-03-24 15:30 觀網(wǎng)財經(jīng)-科創(chuàng) -
五大芯片巨頭來華參會,高通三星高管到訪小米汽車工廠
2025-03-24 11:44 觀網(wǎng)財經(jīng)-科創(chuàng) -
中科院專家:RISC-V開辟中國芯片自主新賽道,還需攻克“三座大山”
2025-03-23 16:07 觀網(wǎng)財經(jīng)-科創(chuàng) -
絲芙蘭迷失在中國,全球CEO緊急“救火”
2025-03-23 09:39 觀網(wǎng)財經(jīng)-消費 -
華為楊超斌:已有超80家伙伴基于昇騰打造大模型一體機
2025-03-22 21:40 觀網(wǎng)財經(jīng)-科創(chuàng) -
從鴻蒙手機到鴻蒙電腦,華為終端鴻蒙化提速
2025-03-22 08:40 觀網(wǎng)財經(jīng)-科創(chuàng) -
消息稱盒馬醞釀新店型,布局“1店+N倉”模式
2025-03-22 00:10 觀網(wǎng)財經(jīng)-消費 -
中美科技博弈下,233萬用戶選擇把票投給“WPS鴻蒙版”
2025-03-21 23:59 觀網(wǎng)財經(jīng)-科創(chuàng) -
嘉士伯控股重慶啤酒被指打壓民族品牌“山城”?真相沒那么簡單
2025-03-21 21:08 觀網(wǎng)財經(jīng)-消費 -
名創(chuàng)優(yōu)品2024年營收同比增長22.8%,全球門店凈增1219家
2025-03-21 21:07 觀網(wǎng)財經(jīng)-消費 -
蘋果AI被指控虛假宣傳
2025-03-21 20:59 觀網(wǎng)財經(jīng)-科創(chuàng) -
美團2024年財報:全年營收3376億元,交易用戶數(shù)破7.7億
2025-03-21 20:54 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng)
相關推薦 -
最新聞 Hot
-
家樂福CEO放話:對中國小包裹,要學特朗普征稅100%
-
“還想阻撓大陸武統(tǒng)?美國造船投資太晚了”
-
受賄數(shù)額特別巨大,齊同生被提起公訴
-
“美國占一半,中國分四成,歐洲...”
-
“西門子收到通知,美國已解除這項對華禁令”
-
叫完“爸爸”又被白宮整活,北約秘書長:驚喜且有趣
-
印度外長在美表態(tài):要這么對中國
-
中國緊盯貿(mào)易協(xié)議,“若誰聯(lián)美抗中,必遭反制”
-
“美國人自豪感急劇下降,特別是民主黨人”
-
“富士康要求中國員工從印度撤離”
-
美方撤銷對華乙烷出口限制
-
特朗普參觀“鱷魚惡魔島”:拜登就想把我關在這兒,這XX養(yǎng)的
-
公安部通報:陳某為吸粉引流編造“工行假金條”,已被依法追責
-
“2027年起,整個產(chǎn)業(yè)將拱手讓給中國”
-
特朗普威脅:敢礙事,就逮捕你
-
“7年前就發(fā)現(xiàn)問題了,一直沒修”
-