-
阿里云發(fā)布QwQ-32B:僅用1/20參數(shù)比肩滿血DS-R1,可在消費(fèi)級顯卡部署
-
連政guanchazhewanxgun
最后更新: 2025-03-06 11:42:483月6日凌晨,阿里云發(fā)布并開源全新的推理模型通義千問QwQ-32B。官方稱,這個(gè)新模型僅僅擁有320億參數(shù),但在性能上比肩6710億參數(shù)的滿血版DeepSeek R1。
目前,阿里云并未發(fā)布還完整技術(shù)報(bào)告,但官方數(shù)據(jù)顯示,QwQ-32B僅在編程競賽(LiveCodeBench)和美國數(shù)學(xué)競賽(AIME24)兩項(xiàng)略遜于滿血的DeepSeek-R1,其余三項(xiàng)則全面超越。此外更是碾壓完全超越了OpenAI-o1-mini。
阿里云解釋稱,團(tuán)隊(duì)此次基于Qwen2.5-32B模型,探索了擴(kuò)展強(qiáng)化學(xué)習(xí)(RL)的技術(shù)方案,并發(fā)現(xiàn)強(qiáng)化學(xué)習(xí)訓(xùn)練能夠持續(xù)提升模型性能,尤其在數(shù)學(xué)與編程任務(wù)中表現(xiàn)顯著。該團(tuán)隊(duì)還提到,通過持續(xù)擴(kuò)展強(qiáng)化學(xué)習(xí)訓(xùn)練的規(guī)模,中型模型也可以實(shí)現(xiàn)與巨型混合專家模型(MoE)相媲美的性能。
此外,QwQ-32B還滿足更低的資源消耗需求,適合快速響應(yīng)或?qū)?shù)據(jù)安全要求高的應(yīng)用場景,開發(fā)者和企業(yè)可以在消費(fèi)級顯卡上將其部署到本地設(shè)備中,進(jìn)一步打造高度定制化的AI解決方案。阿里稱,QwQ-32B已多個(gè)平臺(tái)基于寬松的Apache2.0協(xié)議開源,所有人都可免費(fèi)下載模型進(jìn)行本地部署,或者通過阿里云百煉平臺(tái)直接調(diào)用模型API服務(wù)。
值得一提的是,此前OpenAI曾因遇到技術(shù)瓶頸,將原來的GPT5.0降格為GPT4.5進(jìn)行發(fā)布,之后還透露將降低強(qiáng)化學(xué)習(xí)訓(xùn)練的優(yōu)先級,轉(zhuǎn)向監(jiān)督學(xué)習(xí)(SSL)和語言模型(LM)為核心的技術(shù)路線。而QwQ-32B的發(fā)布則證明了強(qiáng)化學(xué)習(xí)路線仍有潛力,可以繼續(xù)提升模型的性能。
千問QwQ-32B模型中還集成了與智能體Agent相關(guān)的能力,使其能夠在使用工具的同時(shí)進(jìn)行批判性思考,并根據(jù)環(huán)境反饋調(diào)整推理過程。通義團(tuán)隊(duì)表示,未來將繼續(xù)探索將智能體與強(qiáng)化學(xué)習(xí)的集成,以實(shí)現(xiàn)長時(shí)推理,探索更高智能進(jìn)而最終實(shí)現(xiàn)AGI的目標(biāo)。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 連政 
-
算力版圖的國運(yùn)賭局
2025-03-06 10:28 -
今年政府債務(wù)增加2.9萬億,都用在哪?
2025-03-05 21:26 2025兩會(huì) -
烘培、燒烤、麻辣燙……海底撈“副牌”狂奔
2025-03-05 19:01 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
-
微軟推出免費(fèi)廣告版Office?網(wǎng)友:怕是欺負(fù)外國用戶沒用過WPS
2025-03-05 17:46 觀網(wǎng)財(cái)經(jīng)-海外 -
大模型工具Ollama存在安全隱患,本地部署Deepseek需小心
2025-03-05 17:30 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
-
-
追趕騰訊!字節(jié)跳動(dòng)最新估值3150億美元
2025-03-05 17:25 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
全國人大代表趙紅果:加快制定完善的新茶飲行業(yè)標(biāo)準(zhǔn)
2025-03-05 17:24 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
張頤武、戶思社委員:建議加大對侵犯著作權(quán)犯罪懲治力度
2025-03-05 17:23 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
-
年薪250萬的CFO離職,舍得酒業(yè)人事頻繁動(dòng)蕩
2025-03-05 17:16 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
使用騰訊元寶將被迫授予文章使用權(quán)?官方回應(yīng)
2025-03-05 17:05 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
李云澤表態(tài)拉長穩(wěn)樓市白名單,專家:有助增強(qiáng)民企投資信心
2025-03-05 16:19 2025兩會(huì) -
-
-
巴展觀察:華為傳音展示三折疊,聯(lián)想太陽能PC亮相
2025-03-05 13:26 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
支線物流起飛!順豐訂購百架翊飛航空大型無人運(yùn)輸機(jī)
2025-03-05 13:12 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
國產(chǎn)視頻模型企業(yè)愛詩科技再獲億級融資,曾靠“毒液”視頻出圈
2025-03-05 12:56
相關(guān)推薦 -
-
電氣化已落后亞洲,“大而美”法案或令美國雪上加霜 評論 71為什么這支國足被普遍看好? 評論 94最新聞 Hot
-
好一個(gè)“舉賢不避親”,特朗普推薦兒媳參選
-
開庭前妻子墜樓身亡,柯文哲前副手痛哭:臺(tái)灣怎么變成這樣
-
美國放風(fēng):伊朗有動(dòng)作了
-
“中方正考慮邀請李在明出席”
-
“中國洋垃圾禁令震動(dòng)全球”,馬來西亞也跟了
-
靠萬斯“決勝一票”,“大而美”法案驚險(xiǎn)闖關(guān)參議院
-
白宮官員:沒人在乎馬斯克說了什么
-
日澳印各懷心事,魯比奧還想著中國:別談了,得干實(shí)事,搞礦!
-
三年來首次,普京與馬克龍通話
-
“我會(huì)給日本寫信感謝他們,給他們加關(guān)稅”
-
特朗普:奧巴馬糟糕小布什低分,拜登史上最差,而我…
-
美財(cái)長:中國加快稀土出口吧,回到過去
-
“《新華字典》例句稱小孩是累贅”再引爭議,多方回應(yīng)
-
英國樂隊(duì)在音樂節(jié)上高喊“以軍去死”,英美都“炸”了
-
多地宣布“解禁”中華田園犬
-
內(nèi)塔尼亞胡證實(shí)下周訪美,除了特朗普還要見他們
快訊- 國臺(tái)辦:“為臺(tái)澎金馬而戰(zhàn)”?賴清德不惜將無辜民眾綁上“臺(tái)獨(dú)”戰(zhàn)車
- 旅客自棄的充電寶如何處理?國際航班要查嗎?上海機(jī)場集團(tuán)回應(yīng)
- 谷歌因?yàn)E用安卓手機(jī)數(shù)據(jù)被判賠22億
- “中方正考慮邀請李在明出席”
- 以“高志凱線”為中印邊界?高志凱回應(yīng)
- 秦始皇遣使采藥昆侖石刻陷爭議,首次提出者回應(yīng)
- 京津冀一周觀察 | 北京昌平救援驢友將追繳費(fèi)用;河北生育津貼直發(fā)給個(gè)人
- 讓優(yōu)質(zhì)內(nèi)容發(fā)光,抖音全面升級生活垂類創(chuàng)作者扶持計(jì)劃
-