-
騰訊混元開源首款混合推理MoE模型
6月27日,騰訊混元宣布開源首個混合推理MoE模型 Hunyuan-A13B,總參數(shù)80B,激活參數(shù)僅13B,效果比肩同等架構(gòu)領(lǐng)先開源模型,但是推理速度更快,性價比更高。這意味著,開發(fā)者可以用更低門檻的方式獲得更好的模型能力。
即日起,模型已經(jīng)在 Github 和 Huggingface 等開源社區(qū)上線,同時模型API也在騰訊云官網(wǎng)正式上線,支持快速接入部署。
這是業(yè)界首個13B級別的MoE開源混合推理模型,基于先進的模型架構(gòu),Hunyuan-A13B表現(xiàn)出強大的通用能力,在多個業(yè)內(nèi)權(quán)威數(shù)據(jù)測試集上獲得好成績,并且在Agent工具調(diào)用和長文能力上有突出表現(xiàn)。
加粗為最高分,下劃線是第二名,數(shù)據(jù)來源于模型公開的測試數(shù)據(jù)集得分
對于時下熱門的大模型Agent能力,騰訊混元建設(shè)了一套多Agent數(shù)據(jù)合成框架,接入了MCP、沙箱、大語言模型模擬等多樣的環(huán)境,并且通過強化學(xué)習(xí)讓Agent在多種環(huán)境里進行自主探索與學(xué)習(xí),進一步提升了Hunyuan-A13B的效果。
在長文方面,Hunyuan-A13B支持256K原生上下文窗口,在多個長文數(shù)據(jù)集中取得了優(yōu)異的成績。
在實際使用場景中,Hunyuan-A13B模型可以根據(jù)需要選擇思考模式,快思考模式提供簡潔、高效的輸出,適合追求速度和最小計算開銷的簡單任務(wù);慢思考涉及更深、更全面的推理步驟,如反思和回溯。這種融合推理模式優(yōu)化了計算資源分配,使用戶能夠通過加think/no_think切換思考模式,在效率和特定任務(wù)準確性之間取得平衡。
相關(guān)資料顯示,Hunyuan-A13B模型是騰訊內(nèi)部應(yīng)用和調(diào)用量最大的大語言模型之一,有超過400+業(yè)務(wù)用于精調(diào)或者直接調(diào)用,日均請求超1.3億。
混元官方界面截圖
官方界面中顯示,該模型支持快慢思考模式切換,數(shù)學(xué)、科學(xué)、長文理解及Agent能力全面提升。其中,快思考模式適合追求速度和最小計算開銷的簡單任務(wù),而慢思考模式則涉及更深、更全面的推理步驟,這優(yōu)化了計算資源分配,兼顧了效率和準確性。
在實測中,觀察者網(wǎng)測試了小數(shù)比較大小,基本的四則運算等多種基本數(shù)學(xué)題目,Hunyuan-A13B模型都能迅速響應(yīng)并給出正確的回答。
測試問題
據(jù)悉,混元團隊還開源了兩個新數(shù)據(jù)集,以填補行業(yè)內(nèi)相關(guān)評估標準的空白。其中,ArtifactsBench主要用于代碼評估,構(gòu)建了一個包含1825個任務(wù)的新基準;C3-Bench則針對Agent場景模型評估,設(shè)計了1024條測試數(shù)據(jù)。
本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 胡祥熙 
-
特朗普集團悄悄撤下“美國制造”手機承諾
2025-06-27 17:06 觀網(wǎng)財經(jīng)-科創(chuàng) -
小米回應(yīng)“前總監(jiān)大瓜”和貓王音響創(chuàng)始人爭議言論
2025-06-27 16:35 觀網(wǎng)財經(jīng)-科創(chuàng) -
每晚7000仍不盈利,高端月子中心圣貝拉的困境與野心
2025-06-27 16:35 觀網(wǎng)財經(jīng)-消費 -
高度依賴“山茶花精華油”的林清軒,或?qū)⑼瞥鲂缕放啤叭A嫆莊”
2025-06-27 16:21 觀網(wǎng)財經(jīng)-消費 -
飛天茅臺一度跌破1800元盈虧線,白酒調(diào)整遠未筑底?
2025-06-27 15:51 觀網(wǎng)財經(jīng)-消費 -
京東回應(yīng)“試點全職騎手幫扔垃圾”:無強制,仍在早期討論階段
2025-06-27 14:02 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
美團王莆中:中國已是全球服務(wù)消費最便利國家,線上化潛力巨大
2025-06-27 13:03 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
5元咖啡霸主加速擴張,幸運咖全國門店數(shù)突破6000家
2025-06-27 13:03 觀網(wǎng)財經(jīng)-消費 -
網(wǎng)友調(diào)侃LV巨輪要“創(chuàng)飛”星巴克,星巴克中國回應(yīng)
2025-06-27 09:49 觀網(wǎng)財經(jīng)-消費 -
-
小米AI眼鏡1999元起售,行業(yè)人士稱是“半玩具、半工具”
2025-06-27 07:49 觀網(wǎng)財經(jīng)-科創(chuàng) -
榮耀正式啟動A股IPO
2025-06-27 00:38 觀網(wǎng)財經(jīng)-科創(chuàng) -
僅剩15個月,新城悅服務(wù)退市利劍高懸
2025-06-26 20:11 觀網(wǎng)財經(jīng)-房產(chǎn) -
“香水第一股”港交所首日大跌
2025-06-26 17:31 觀網(wǎng)財經(jīng)-消費 -
香港公司接手塔斯汀全部股權(quán),“漢堡界蜜雪冰城”正在籌備上市?
2025-06-26 17:24 -
這家重慶智駕新軍,想要三分天下有其一
2025-06-26 14:17 -
行業(yè)下行期,家居企業(yè)“二代”們開始積極接班
2025-06-26 10:19 觀網(wǎng)財經(jīng)-消費 -
vivo推出全球最輕大折疊,進一步破壁蘋果生態(tài)
2025-06-26 09:00 觀網(wǎng)財經(jīng)-科創(chuàng) -
-
亮相達沃斯論壇工商界代表座談會,劉強東增添“新身份”
2025-06-26 00:38 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng)
相關(guān)推薦 -
最新聞 Hot
-
又鬧翻了!特朗普喊話馬斯克:補貼你拿的最多,DOGE應(yīng)該查查
-
“特朗普都沒見到,你就往中國跑?”,澳總理黑臉…
-
“在中國果斷反制時,歐洲在為美國買單”
-
佩通坦被停職,泰國副總理出任看守總理
-
中國披露新型“石墨炸彈”?“可致目標區(qū)全面斷電”
-
加拿大“慫”了,歐盟也要讓步?
-
特朗普開炮:如果沒有補貼,馬斯克可能早就回南非老家了
-
榮昌區(qū)委書記高洪波回應(yīng)帶頭下館子:我們都不消費,民生就沒有錢了
-
急急急!特朗普拉了一張表,再懟美聯(lián)儲
-
俄方宣稱完全占領(lǐng)盧甘斯克州
-
貶值超10%,美元今年開局表現(xiàn)創(chuàng)52年來最差
-
水均益曬新身份證,辟謠移民
-
伊朗警告烏克蘭:這么做,將產(chǎn)生嚴重后果
-
立菲防長沆瀣一氣:我們都有個“敵對鄰居”
-
“稀土禁令讓全球面臨抉擇:買中國的,不然沒得用”
-
小布什、奧巴馬罕見聯(lián)手譴責(zé)
-