-
DeepSeek“偷偷”發(fā)布新版本,最新測評來了
-
張廣凱13764468101
(文/張廣凱 編輯/呂棟)
昨晚,DeepSeek 以非常低調(diào)的方式,帶來了最新版本的大模型 V3-0324。
沒有官方新聞稿,沒有技術(shù)報告,甚至在Hugging Face上傳的最初文件中,連README文檔都是空的,看上去,這只是V3模型的一次版本升級。
不過由于DeepSeek自帶的極高話題性,這次版本升級還是引發(fā)了大量討論和測評,并且果然沒有令人失望——很多專業(yè)人士都指出,V3-0324模型在編程能力上有了顯著提升。
在大模型編程能力測試Aider LLM中,V3-0324的多語言基準測試得分為55%,相較于此前版本不到50%的水平有明顯進步,并且超越了OpenAI的o3-mini,接近于自家的R1,但仍然稍稍落后于以編程見長的Claude 3.7 sonnet。
考慮到V3-0324并非推理模型,能夠在編程能力上接近R1,算得上是自身短板的精準補強。
另一位博主Xeophon自建的測試集上,V3-0324在綜合能力上超越了Claude 3.5 sonnet,排在它身前的DeepSeek R1,o3-mini和阿里通義的qwq-32b則都是推理模型。
知名的大模型競技場Chatbot Arena也已經(jīng)開始將V3-0324納入測試,但還具體成績還要等待幾天時間。
在目前的Chatbot Arena排行榜上,GPT-4.5-Preview和Grok-3-Preview-02-24并列排在榜首,而DeepSeek R1則排在第6位。
隨著今年以來OpenAI推出最后一代非推理模型GPT-4.5,以及推理模型o3的升級,再加上Grok、Claude和Gemini等模型的持續(xù)迭代,外界對于DeepSeek何時能夠再次升級也有了更高期待。
此前路透社消息稱,DeepSeek下一代推理模型R2可能會比預(yù)期的5月更早發(fā)布。
考慮到DeepSeek R1是以V3作為基礎(chǔ)模型訓(xùn)練而來,此次V3-0324的亮相,或許也意味著R2愈發(fā)臨近了。
本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 張廣凱 
-
騰訊等巨頭攜手入股智元機器人
2025-03-25 13:29 觀網(wǎng)財經(jīng)-科創(chuàng) -
消息稱京東入局具身智能賽道
2025-03-25 13:28 觀網(wǎng)財經(jīng)-科創(chuàng) -
原華為副總裁擔(dān)任智元機器人董事長兼CEO
2025-03-25 12:36 觀網(wǎng)財經(jīng)-科創(chuàng) -
蔡崇信:企業(yè)家信心明顯增強,阿里巴巴將重啟招聘
2025-03-25 11:05 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
上海發(fā)布2025重點產(chǎn)業(yè)布局圖
2025-03-25 10:31 觀網(wǎng)財經(jīng)-宏觀 -
“讓機器服務(wù)于人,而不是人為機器服務(wù)”
2025-03-25 09:29 觀網(wǎng)財經(jīng)-科創(chuàng) -
茶咖日報|茉莉奶白被曝喝出完整塑料袋,官方回應(yīng):已閉店
2025-03-24 21:00 觀網(wǎng)財經(jīng)-消費 -
訊飛星火之后,螞蟻用國產(chǎn)芯片訓(xùn)練出2900億參數(shù)大模型
2025-03-24 18:42 觀網(wǎng)財經(jīng)-科創(chuàng) -
京東外賣上線40天,日訂單首破百萬
2025-03-24 18:12 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
宣布斥資15億布局香港后,京東要把家電價格打到全港最低
2025-03-24 18:12 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
2元一根的妙可藍多奶酪,去年又掙了1.13億
2025-03-24 17:34 觀網(wǎng)財經(jīng)-消費 -
途虎養(yǎng)車全網(wǎng)首發(fā)德國馬牌ExtremeContact XC7全新輪胎產(chǎn)品線
2025-03-24 17:26 -
控量挺價成效待考,舍得酒業(yè)2024年凈利驟降80%
2025-03-24 17:25 觀網(wǎng)財經(jīng)-消費 -
教培跑路頻發(fā),美團這招行不行?
2025-03-24 17:24 觀網(wǎng)財經(jīng)-消費 -
2024年中國財政政策執(zhí)行情況報告發(fā)布
2025-03-24 16:23 -
TCL實業(yè)盧春水:掌握上游技術(shù),才是全球競爭的核心驅(qū)動力
2025-03-24 15:30 觀網(wǎng)財經(jīng)-科創(chuàng) -
五大芯片巨頭來華參會,高通三星高管到訪小米汽車工廠
2025-03-24 11:44 觀網(wǎng)財經(jīng)-科創(chuàng) -
中科院專家:RISC-V開辟中國芯片自主新賽道,還需攻克“三座大山”
2025-03-23 16:07 觀網(wǎng)財經(jīng)-科創(chuàng) -
絲芙蘭迷失在中國,全球CEO緊急“救火”
2025-03-23 09:39 觀網(wǎng)財經(jīng)-消費 -
華為楊超斌:已有超80家伙伴基于昇騰打造大模型一體機
2025-03-22 21:40 觀網(wǎng)財經(jīng)-科創(chuàng)
相關(guān)推薦 -
-
“美國已解除這項對華出口禁令” 評論 271最新聞 Hot
-
“沒客戶!”獲47億補貼后,三星在美芯片廠推遲投產(chǎn)
-
約翰遜急著表決,民主黨領(lǐng)袖連續(xù)講了6小時,還沒?!?/a>
-
“六代機機密會議,扎克伯格突然闖入”,白宮回應(yīng)
-
8年后,默克爾吐槽特朗普:真裝!
-
美軍評估又變了,“不是幾個月是兩年”
-
“即使特朗普下臺,美國政策也不會變,中日韓要合作”
-
“船到橋頭自然直”,印外長回應(yīng)美議員
-
俄海軍副總司令陣亡
-
“在越南的中國制造商松了一口氣”
-
他倒戈后就躲起來了,電話都不接,同僚評價:聰明
-
“美國已解除這項對華出口禁令”
-
“印軍將全面排查中國產(chǎn)零部件”
-
美國和盟友鬧掰?“本質(zhì)沒變,中國需高度警惕”
-
斯塔默不吱聲,英財相當(dāng)場落淚,“哭崩”市場
-
家樂福CEO放話:對中國小包裹,要學(xué)特朗普征稅100%
-
莫迪表態(tài):金磚是重要平臺
-