-
美團自研560B大模型并開源,性能趕超DeepSeek
最后更新: 2025-09-08 14:42:14比如在衡量模型綜合知識水平的核心指標(MMLU/MMLU-Pro)中,龍貓大模型的得分是89.71和82.68,與DeepSeek V3.1、Qwen3 MoE、Kimi-K2、GPT4.1和Claude4 Sonnet等行業(yè)頂尖大模型均不相上下,反映了龍貓扎實的基礎(chǔ)知識和推理能力。
再比如在指令遵循(Instruction Following)的三個指標中,龍貓大模型得分均超越了DeepSeek V3.1、Qwen3 MoE、Kimi-K2和GPT4.1等模型,反映了多階段訓練的成果。
ArenaHard-V2更側(cè)重模型作為聊天助手的“體感”和處理復雜指令的能力,龍貓大模型的得分為86.50,超過DeepSeek V3.1,與 Qwen3 MoE的88.20非常接近。而作為中文領(lǐng)域的權(quán)威測試,龍貓在CEval上的得分為90.44,在CMMLU上也保持了第一梯隊水平。
首秀就有如此優(yōu)秀的表現(xiàn),讓外界不禁好奇龍貓大模型是在什么硬件平臺上訓練的?
美團技術(shù)報告披露的信息是,龍貓大模型是在數(shù)萬個加速器(tens of thousands of accelerators)上完成訓練的,但并未給出具體硬件廠商的名字。
需要指出的是,無論基于哪種硬件平臺,在30天內(nèi)就能完成20萬億token的訓練,足以說明美團技術(shù)團隊有能力在復雜的約束條件下,深入底層去解決核心的系統(tǒng)工程問題。
自研大模型,美團AI戰(zhàn)略落地的必然
拋開技術(shù)層面,大家更關(guān)心的是,美團作為一家本地生活巨頭,為何要斥巨資研發(fā)大模型?
進軍大模型的思考,美團CEO王興其實在3月的年報業(yè)績會上做出過解答。他當時強調(diào),AI將改變和顛覆所有行業(yè),我們對此感到興奮。作為一家將線下業(yè)務(wù)與線上世界連接起來的公司,“我們將利用所擁有的一切去嘗試進攻,主動在AI方面實現(xiàn)我們的領(lǐng)先地位?!?
當時王興把美團AI戰(zhàn)略解構(gòu)為三個方面:首先是工作中的AI(AI at Work),用以提升內(nèi)部員工的生產(chǎn)力;其次是產(chǎn)品中的AI(AI in Products),用AI升級現(xiàn)有服務(wù),并推出全新AI原生產(chǎn)品;最后是這一切的基石,就是構(gòu)建美團自己的大語言模型(Building LLM)。
龍貓大模型的誕生,可以說是美團AI戰(zhàn)略落地的必然。就業(yè)務(wù)本身來說,美團的本地生活涉及的物流、服務(wù)業(yè)都有著勞動力密集、高頻互動的特點,都屬于AI改造潛力很大的領(lǐng)域。對于美團來說,無論是戰(zhàn)略防御還是更積極的態(tài)度,大模型都是必須要做的事情。
市場上雖然也有不少開源模型,但無論多么強大,都無法媲美美團對垂直場景的理解和近乎100%的執(zhí)行可靠性。因此唯一的路徑,就是訓練一個從誕生之初就浸泡在美團自身數(shù)據(jù)和業(yè)務(wù)邏輯中的模型,一個高可靠性的模型,這也是龍貓大模型被創(chuàng)造出來的核心原因。
目前,龍貓大模型LongCat-Flash-Chat,已經(jīng)發(fā)布在Hugging Face和Githiub開源社區(qū),并遵循MIT許可協(xié)議。這場本地生活巨頭對AI的深度擁抱,讓全球?qū)W術(shù)界和產(chǎn)業(yè)界的研究者、開發(fā)者也都可以自由使用和探索龍貓這個強大的模型,共同推動AI技術(shù)的發(fā)展。
- 責任編輯: 呂棟 
-
iPhone17 Pro被曝將漲價5%,Air版首發(fā)無國行?
2025-09-08 14:35 觀網(wǎng)財經(jīng)-科創(chuàng) -
網(wǎng)絡(luò)炒作在英涉嫌避稅 SHEIN:對造謠和抹黑會啟動法律程序
2025-09-07 20:47 -
證監(jiān)會:堅決擁護黨中央決定
2025-09-06 21:08 廉政風暴 -
易會滿:從“草根行長”到金融巨虎的墜落
2025-09-06 20:54 金融觀察 -
王化回應(yīng)小米手機測試30萬小時
2025-09-06 15:38 觀網(wǎng)財經(jīng)-科創(chuàng) -
始祖鳥母公司遭lululemon創(chuàng)始人拋售,今年將出現(xiàn)凈關(guān)店
2025-09-06 10:13 觀網(wǎng)財經(jīng)-消費 -
好利來公子創(chuàng)立的EHB餐廳官宣閉店,曾人均消費近萬元
2025-09-06 10:13 觀網(wǎng)財經(jīng)-消費 -
魏家涼皮被顧客“聯(lián)手做局”?警方通報:老鼠確系25歲男子故意放置
2025-09-06 10:09 觀網(wǎng)財經(jīng)-消費 -
傳騰訊參與競購星巴克
2025-09-05 19:44 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
澳優(yōu)乳業(yè)上半年營收利潤雙增,國際業(yè)務(wù)成第二增長引擎
2025-09-05 19:41 觀網(wǎng)財經(jīng)-消費 -
曝中國聯(lián)通將支持eSIM版iPhone17
2025-09-05 19:38 觀網(wǎng)財經(jīng)-科創(chuàng) -
“雪王”秒了,王冠沉重
2025-09-05 19:36 觀網(wǎng)財經(jīng)-消費 -
熱搜警告:布洛芬配咖啡,傷胃傷腎“雙重刺激”
2025-09-05 19:04 觀網(wǎng)財經(jīng)-消費 -
中國銀聯(lián):終止花旗中國成員資格
2025-09-05 17:13 金融觀察 -
三連跌后強勢反彈,滬指重回3800點
2025-09-05 16:25 觀網(wǎng)財經(jīng)-消費 -
美國AI獨角獸宣稱停止服務(wù)中國公司,針對DeepSeek?
2025-09-05 16:07 觀網(wǎng)財經(jīng)-科創(chuàng) -
時隔近20年,劉強東重啟“用戶見面會”
2025-09-05 14:56 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
業(yè)績雪崩的“徽酒老二”迎駕貢酒,想起來重新聚焦主業(yè)了
2025-09-05 12:45 觀網(wǎng)財經(jīng)-消費 -
DeepSeek年底前發(fā)布AI智能體;智元機器人走穴;華為手表出貨量超蘋果
2025-09-05 09:24 觀網(wǎng)財經(jīng)-科創(chuàng) -
追覓入局無人機,憑什么?
2025-09-04 20:36 觀網(wǎng)財經(jīng)-科創(chuàng)
相關(guān)推薦 -
細節(jié)曝光,“日本將任由特朗普擺布” 評論 174坎貝爾不死心:美國頭回碰上,單打獨斗贏不了中國 評論 333最新聞 Hot
-
時隔7年會談重啟,英國新任商貿(mào)大臣本周將訪華
-
以色列稱西班牙“反猶”,西班牙召回駐以大使
-
“你們有權(quán)推翻政府,但不能抹去現(xiàn)實,法國病了”
-
“這兒只有一個玩家就是中國,美國甚至都沒在房間里”
-
印尼示威游行后內(nèi)閣大規(guī)模改組:資深財長被撤換
-
他信返回泰國,將于9日聽取法院裁決
-
槍手系巴勒斯坦人,哈馬斯回應(yīng)
-
巴民族權(quán)力機構(gòu)罕見發(fā)聲:譴責任何針對平民的傷害
-
細節(jié)曝光,“日本將任由特朗普擺布”
-
韓國人還在震驚、憤怒中…
-
歐盟:放心,翻篇了
-
昂山素季被曝健康狀況惡化,緬甸軍方否認
-
佩通坦:他信今天肯定回國
-
美韓“助力”,讓菲律賓造船業(yè)再次偉大?
-
加政府被懟:誰稀罕補貼?還是取消對華關(guān)稅吧
-
“美國人有一句感恩嗎?中國人曾經(jīng)太天真”
-