在线 | 一区二区三区,中文字幕精品久久久久人妻红杏1 中文字幕精品久久久久人妻

APP下載

掃一掃

下載觀察者APP

阿里“最強(qiáng)開(kāi)源模型”，昇騰、海光已適配
- 楊依婷
分享到：

2025-04-29 14:21:11 字號(hào)：A- A A+ 來(lái)源：觀察者網(wǎng)

最后更新: 2025-04-29 14:30:26

（文/楊依婷編輯/呂棟）

4月29日凌晨，阿里新一代通義千問(wèn)模型Qwen3發(fā)布并開(kāi)源，它的參數(shù)量?jī)H為DeepSeek-R1的1/3，但成本大幅下降，性能超越R1、OpenAI-o1等全球頂尖模型，被媒體稱(chēng)為“全球最強(qiáng)開(kāi)源模型”。

隨后，華為計(jì)算官方發(fā)文稱(chēng)，此次Qwen3系列一經(jīng)發(fā)布開(kāi)源，即在MindSpeed和MindIE中開(kāi)箱即用，實(shí)現(xiàn)Qwen3的0Day適配。海光信息方面也表示，海光DCU迅速完成對(duì)全部8款模型的無(wú)縫適配+調(diào)優(yōu)。

根據(jù)阿里云官方信息，此次開(kāi)源包括兩款MoE模型：Qwen3-235B-A22B（2350多億總參數(shù)、 220多億激活參），以及Qwen3-30B-A3B（300億總參數(shù)、30億激活參數(shù)）；以及六個(gè)Dense模型：Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。

其中的旗艦?zāi)Ｐ蚎wen3-235B-A22B在代碼、數(shù)學(xué)、通用能力等基準(zhǔn)測(cè)試中，與DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等頂級(jí)模型相比，表現(xiàn)出極具競(jìng)爭(zhēng)力的結(jié)果。

此外，小型MoE模型Qwen3-30B-A3B的激活參數(shù)數(shù)量是QwQ-32B的10%，表現(xiàn)更勝一籌，甚至像Qwen3-4B這樣的小模型也能匹敵Qwen2.5-72B-Instruct的性能。

Qwen3是國(guó)內(nèi)首個(gè)“混合推理模型”，模型支持兩種思考模式：思考模式：在這種模式下，模型會(huì)逐步推理，經(jīng)過(guò)深思熟慮后給出最終答案。這種方法適合需要深入思考的復(fù)雜問(wèn)題。非思考模式：在此模式中，模型提供快速、近乎即時(shí)的響應(yīng)，適用于那些對(duì)速度要求高于深度的簡(jiǎn)單問(wèn)題。

在預(yù)訓(xùn)練方面，Qwen3的數(shù)據(jù)集相比Qwen2.5有了顯著擴(kuò)展。Qwen2.5是在18萬(wàn)億個(gè)token上進(jìn)行預(yù)訓(xùn)練的，而Qwen3使用的數(shù)據(jù)量幾乎是其兩倍，達(dá)到了約36萬(wàn)億個(gè)token，涵蓋了119種語(yǔ)言和方言。

從官方數(shù)據(jù)來(lái)看，在考察代碼能力的LiveCodeBench評(píng)測(cè)中，Qwen3突破70分大關(guān)，表現(xiàn)甚至超過(guò)Grok3；在評(píng)估模型人類(lèi)偏好對(duì)齊的ArenaHard的測(cè)評(píng)中，Qwen3分別以95.6分超越了OpenAI-o1及DeepSeek-R1；在評(píng)估奧數(shù)水平的AIME25測(cè)評(píng)中，Qwen3以81.5分刷新開(kāi)源記錄。

Qwen3發(fā)布后，華為計(jì)算方面發(fā)文稱(chēng)，此前昇騰MindSpeed和MindIE一直同步支持Qwen系列模型，此次Qwen3系列一經(jīng)發(fā)布開(kāi)源，即在MindSpeed和MindIE中開(kāi)箱即用，實(shí)現(xiàn)Qwen3的0Day適配。

隨后海光信息也表示，在“深算智能”戰(zhàn)略引領(lǐng)下，海光DCU迅速完成對(duì)全部8款模型的無(wú)縫適配+調(diào)優(yōu)，覆蓋235B/32B/30B/14B/8B/4B/1.7B/0.6B，實(shí)現(xiàn)零報(bào)錯(cuò)、零兼容性問(wèn)題的秒級(jí)部署。

本文系觀察者網(wǎng)獨(dú)家稿件，未經(jīng)授權(quán)，不得轉(zhuǎn)載。
|

舉報(bào)
- 違反法律法規(guī)
- 垃圾信息、廣告
- 色情、淫穢信息
- 人身攻擊
- 謠言、不實(shí)信息
- 冒充，冒用信息
- 破壞社區(qū)秩序
- 其他
- 涉未成年人有害信息
觀察者網(wǎng)舉報(bào)制度規(guī)范
確定取消
標(biāo)簽華為 Qwen3
- 責(zé)任編輯: 楊依婷
搜索

   觀察者頭條查看全部

“特朗普傾向于烏克蘭割讓領(lǐng)土，而非?；稹?/a> 評(píng)論 41

盧拉慶祝中企開(kāi)廠，內(nèi)涵美歐：誰(shuí)想走就走吧評(píng)論 24

美俄首腦峰會(huì)“如會(huì)”，拍完照得不到的依然得不到評(píng)論 55

印度高官膨脹了：不想當(dāng)下一個(gè)中國(guó) 評(píng)論 211

新西蘭防長(zhǎng)咋呼：中國(guó)太讓我意外了，敲醒我評(píng)論 240

   風(fēng)聞 · 24小時(shí)最熱查看全部

   最新視頻查看全部
最新聞 Hot
快訊

成人免费午夜在线观看,伊人久久精品,一区二区三区精品

阿里“最強(qiáng)開(kāi)源模型”，昇騰、海光已適配

美的格力隔空打架，誰(shuí)是“家用空調(diào)線上零售第一”？

特朗普發(fā)動(dòng)單邊貿(mào)易霸凌后，比交易更“藝術(shù)”的事情出現(xiàn)了…

向AI電商領(lǐng)域進(jìn)軍，ChatGPT搜索上線購(gòu)物推薦功能

阿里發(fā)布并開(kāi)源模型Qwen3，成本僅為DeepSeek-R1的1/3

Qwen3性能超越DS-R1；曝馬斯克孩子遠(yuǎn)超14個(gè)；ChatGPT推出購(gòu)物功能

截至3月末，全國(guó)地方政府債務(wù)余額501650億元

茶咖日?qǐng)?bào)｜滬上阿姨5月8日起在港交所交易

最強(qiáng)“蘋(píng)”替？vivo稱(chēng)備貨幾十萬(wàn)的新旗艦已缺貨

華為獨(dú)占近80%份額，折疊屏的戰(zhàn)爭(zhēng)結(jié)束了嗎？

Switch新機(jī)或?qū)⒚媾R高額關(guān)稅沖擊，消費(fèi)者擔(dān)憂價(jià)格上漲

加碼多模態(tài)能力，夸克發(fā)布全新“AI相機(jī)”

AIDC建設(shè)與國(guó)產(chǎn)替代加速，良信股份一季度營(yíng)利雙增

Kimi與財(cái)新傳媒達(dá)成內(nèi)容合作上線權(quán)威信源徽章認(rèn)證

美債下跌會(huì)否影響中國(guó)的美元資產(chǎn)收益？央行回應(yīng)

穩(wěn)健領(lǐng)跑，濱江集團(tuán)首進(jìn)全國(guó)前十

歐菲光一季度再虧5895萬(wàn)：手機(jī)汽車(chē)都卷，怎么辦？

寶馬中國(guó)宣布接入DS；美的人形機(jī)器人5月進(jìn)廠；哪吒2獲華表獎(jiǎng)特別貢獻(xiàn)影片

五糧液2024年?duì)I收近900億元，毛利率超82%

超越DeepSeek，中國(guó)開(kāi)源“集團(tuán)軍”重塑全球AI生態(tài)

“落寞網(wǎng)紅”綠茶，為IPO愛(ài)上下沉市場(chǎng)

“SpaceX靠美國(guó)政府合同賺錢(qián)，卻幾乎不繳納聯(lián)邦所得稅”

“白素貞”被聘為青城山文旅推薦官

李滔，跨省履新云南

“上海第三機(jī)場(chǎng)”有新進(jìn)展

印度高官膨脹了：不想當(dāng)下一個(gè)中國(guó)

“普特會(huì)”談近3小時(shí)未達(dá)成協(xié)議，普京：下次去莫斯科

新西蘭防長(zhǎng)咋呼：中國(guó)太讓我意外了，敲醒我

警惕！歐盟想學(xué)美國(guó)對(duì)華打“臺(tái)灣牌”

特朗普搞了個(gè)企業(yè)效忠榜：看看誰(shuí)最聽(tīng)話

“普特會(huì)”釋放緩和信號(hào)，俄烏沖突離停火還有多遠(yuǎn)？

“澤連斯基非常緊張”

特朗普：我打10分

日本戰(zhàn)敗日談話為何“燙嘴”？

普京前往阿拉斯加的蘇聯(lián)飛行員墓地獻(xiàn)花

河南漯河：從佛山、廣州返回需健康監(jiān)測(cè)12天

李天慶任中日友好醫(yī)院黨委書(shū)記

阿里“最強(qiáng)開(kāi)源模型”，昇騰、海光已適配

阿里“最強(qiáng)開(kāi)源模型”，昇騰、海光已適配