-
首個(gè)國(guó)產(chǎn)“手機(jī)智能體”問世,智譜補(bǔ)位Manus
(文/陳濟(jì)深 編輯/張廣凱)
8月20日,智譜在iOS安卓,PC三端同步推出AutoGLM 2.0,并首次面向公眾全面開放,無(wú)需邀請(qǐng)碼即可使用。
作為一款純國(guó)產(chǎn)智能體,AutoGLM的發(fā)布也給了中國(guó)用戶一個(gè)在Manus退出中國(guó)后可以合規(guī)便利體驗(yàn)智能體的選擇。
不同于Manus等網(wǎng)頁(yè)端原生的智能體產(chǎn)品,智譜AutoGLM 2.0作為全球首個(gè)手機(jī)通用Agent,被定位為“執(zhí)行型助手”。相比目前主流AI產(chǎn)品和智能體助手多停留在“對(duì)話”層面,只能實(shí)現(xiàn)信息查詢和整理回答,AutoGLM則實(shí)現(xiàn)了質(zhì)的飛躍——它不再只是“說(shuō)”,而是真正能夠“做”。
3月AutoGLM1.0發(fā)布時(shí),AI盡管也可以操作手機(jī),但是在AI做事期間人不能切屏,不能打斷,只能看著干瞪眼。本次AutoGLM2.0則給每個(gè)用戶預(yù)制了一臺(tái)虛擬手機(jī)和電腦,直接解決了AI和人搶屏幕的操作痛點(diǎn),讓AI從只能在人眼皮子底下干活變成了“你干你的,我干我的”的異步處理模式。
在實(shí)際測(cè)試中,盡管部分功能的執(zhí)行效率和優(yōu)化程度依然有待提升,但目前AutoGLM已經(jīng)可以較好地執(zhí)行包括購(gòu)物、訂餐、買機(jī)票、自動(dòng)寫文案等大眾場(chǎng)景,智能體不再是極客們的工具,開始步入了更加大眾的群體。
作為全球首個(gè)通用手機(jī)智能體,AutoGLM的發(fā)布也代表著AI從能說(shuō)會(huì)道到真能干活的技術(shù)躍遷,而AI不再需要和人類爭(zhēng)搶手機(jī)開啟“自動(dòng)駕駛模式”,不僅有效地解放了真人諸多日常繁瑣操作的時(shí)間,能夠24小時(shí)執(zhí)行任務(wù)的數(shù)字“牛馬”也直接打開了Agent發(fā)展的無(wú)數(shù)可能性。
用嘴真能操作手機(jī)
Agent毫無(wú)疑問是AI行業(yè)2025年最炙手可熱的關(guān)鍵詞,Manus的出現(xiàn)一度讓Linux底座+調(diào)用外部API“套殼”成為了行業(yè)的主流選擇。但隨著Claude加緊對(duì)中國(guó)的限制,Manus“跑路”新加坡退出中國(guó)后,“套殼”智能體模式在中國(guó)顯然難以為繼。
同時(shí),中國(guó)用戶側(cè)重移動(dòng)端的特點(diǎn)也和傳統(tǒng)Agent重PC端輕移動(dòng)端的思路有所沖突,對(duì)于AI智能體到底應(yīng)該是什么產(chǎn)品形態(tài),顯然需要更加了解中國(guó)用戶的中國(guó)公司去探索開發(fā)。
智譜總裁張鵬對(duì)觀察者網(wǎng)表示:“早在2023年底,(智譜)就決定一定要讓Agent有能力去使用手機(jī),有能力去使用電腦,有能力去使用設(shè)備?!?
他表示,一方面目前互聯(lián)網(wǎng)上,很多基礎(chǔ)設(shè)施都隱藏在各種網(wǎng)站和數(shù)據(jù)庫(kù)中,如果不采用類似人工點(diǎn)擊瀏覽器登錄的模式,也沒有辦法充分發(fā)揮個(gè)人所擁有的生產(chǎn)資料和數(shù)據(jù)帶給你的價(jià)值。
另一方面,如果AI不能自己操作設(shè)備,那么很多定時(shí)任務(wù)就需要人工點(diǎn)擊開始,而不能類似鬧鐘一般自動(dòng)執(zhí)行,也難言智能。
相比傳統(tǒng)的問答式和信息輔助式的手機(jī)智能助手主要通過(guò)AI輸出文本答案讓用戶自己根據(jù)指示操作,本次新發(fā)布的AutoGLM內(nèi)置了智譜GLM4.5模型,不僅全部國(guó)產(chǎn)還實(shí)現(xiàn)了端到端操作設(shè)備的能力,讓AI真的長(zhǎng)出了“手”,替用戶自動(dòng)操作設(shè)備。
在我們的測(cè)試任務(wù)中,諸如在趙露思微博超話打卡,點(diǎn)開B站熱門視頻發(fā)布彈幕,美團(tuán)下單奶茶等單一任務(wù),AutoGLM都能迅速在無(wú)需干預(yù)的情況下一氣呵成,而傳統(tǒng)多模態(tài)模型的任務(wù)更是信手拈來(lái)。
AI生成莫奈風(fēng)格雨中路人圖
面對(duì)稍微復(fù)雜一點(diǎn)的單一APP全鏈路操作,AutoGLM也能勝任。
在向AI提出“搜索知乎今日最熱門的話題,總結(jié)一下高贊評(píng)論的核心觀點(diǎn),然后關(guān)注點(diǎn)贊數(shù)前三的博主”的需求后,AutoGLM直接登陸了知乎并看到了今日最熱門的話題《黑神話:鐘馗》的官宣,隨后整理了高贊內(nèi)容的核心并順利的關(guān)注點(diǎn)贊了前三的答主。
而隨著任務(wù)進(jìn)一步復(fù)雜涉及長(zhǎng)鏈路,多應(yīng)用交互的行為,AutoGLM也能做到常用場(chǎng)景下基礎(chǔ)操作層面的游刃有余。
再給出“播放QQ音樂,搜索今日熱門歌曲播放,然后搜索B站東方明珠大戰(zhàn)蜜雪冰城熱門視頻播放并一鍵三連”的提示后,AutoGLM成功播放了排行榜第一的熱門歌曲時(shí)代少年團(tuán)“I Like U Like”,然后打開了B站搜索并播放了“在上海隨便喝蜜雪冰城,故鄉(xiāng)會(huì)保護(hù)你”的視頻
值得注意的是,AutoGLM并沒有在搜索結(jié)果中選擇標(biāo)題中明確帶有東方明珠和蜜雪冰城字樣的內(nèi)容,而是似乎理解了這個(gè)主題,選擇了播放量最高的相關(guān)內(nèi)容。
不過(guò)在測(cè)試過(guò)程中,在支付、發(fā)布帖子等環(huán)節(jié),依然需要人類接管確認(rèn),我們不止一次遇到在自動(dòng)發(fā)布文案時(shí)觸發(fā)風(fēng)控/系統(tǒng)連接限制等情況無(wú)法發(fā)帖的情況。
而想要使用云手機(jī)和云電腦,用戶需要提前在虛擬設(shè)備上登錄賬號(hào)。對(duì)于用戶安全和隱私問題,智譜表示,其云服務(wù)與阿里云合作,智譜并不會(huì)讀取用戶的登錄信息。但是如何贏得用戶的信任顯然并不是一個(gè)簡(jiǎn)單的問題,也不是智譜一家企業(yè)能夠自行解決的痛點(diǎn)。本次智譜沒有在默認(rèn)程序中內(nèi)置微信這個(gè)國(guó)民應(yīng)用的理由,恐怕也是出于這方面的用戶顧慮。
在初步體驗(yàn)后,可以發(fā)現(xiàn)AutoGLM除了讓普通用戶也能體驗(yàn)到AI智能體的便捷外,它的出現(xiàn)也顯著的幫助了另一個(gè)很容易被忽視的群體——中老年用戶。
互聯(lián)網(wǎng)時(shí)代,隨著數(shù)字化和智能化的發(fā)展,無(wú)論是銀行,醫(yī)院,還是政務(wù)類業(yè)務(wù),在線或者掃碼辦理成為了司空見慣的日常,而很多APP的交互設(shè)計(jì)對(duì)于老年人群體來(lái)說(shuō)難度顯而易見。
另一方面,中老年群體在自主學(xué)習(xí)如何下載APP時(shí),也很容易在安裝各類APP軟件的過(guò)程中無(wú)意間下載廣告乃至詐騙軟件而不自知。
AutoGLM的出現(xiàn)給出了一個(gè)可行的解決方案,讓人適應(yīng)APP轉(zhuǎn)變成了AI代人操作APP,用嘴操作手機(jī),讓AI來(lái)實(shí)現(xiàn)萬(wàn)物互聯(lián)的愿景,方便各類人群使用。
Agent“云端執(zhí)行”的戰(zhàn)略拐點(diǎn)
相比Manus等Agent采用Linux+VSCode的配置范式,智譜本次采用了云端手機(jī)+電腦的技術(shù)新范式。
對(duì)于為何選擇云端執(zhí)行的戰(zhàn)略,智譜總裁張鵬分享了AutoGLM的「3A 原則」:
Around-the-clock(全時(shí)),是指AI 必須能夠 24 小時(shí)待命并持續(xù)執(zhí)行任務(wù)。無(wú)論用戶是在工作、睡覺還是娛樂,AI 都應(yīng)在云端持續(xù)產(chǎn)出價(jià)值。
Autonomy without interference(自運(yùn)轉(zhuǎn)、零干擾),官方也稱之為 Asynchronous (異步),其核心是 Agent 在云端設(shè)備的獨(dú)立運(yùn)行,不占用用戶的本地屏幕和算力。
Affinity(全域連接),則意味著Agent 的能力不能局限于瀏覽器對(duì)話框,必須能連接手機(jī)、電腦、手表、眼鏡等多種設(shè)備與服務(wù),打通數(shù)字世界與物理世界。這三大原則,共同構(gòu)成了 AutoGLM 對(duì)一個(gè)成熟 Agent 形態(tài)的定義,也解釋了其當(dāng)前產(chǎn)品架構(gòu)。
而為了實(shí)現(xiàn)這個(gè)愿景,選擇云手機(jī)和電腦不僅能解決用戶和AI搶屏幕的痛點(diǎn),也解決了軟件適配的難度,成為了順理成章的選擇。
AutoGLM技術(shù)負(fù)責(zé)人、算法研究員劉瀟對(duì)觀察者網(wǎng)解釋道:“如果智能體為滿足用戶需求諸如點(diǎn)外賣,發(fā)微信都需要搶占手機(jī)屏幕,AI在做事時(shí)真人就不能插手,這種讓人類二選一的情況既不智能也不合理,因此通過(guò)本地調(diào)用APP搶占用戶屏幕并不是一個(gè)合適的解決方案?!?
搶屏幕帶來(lái)的一個(gè)副作用便是執(zhí)行中斷的可能,鎖屏、網(wǎng)絡(luò)波動(dòng)、切換應(yīng)用等任何用戶行為都可能中斷 Agent 的長(zhǎng)任務(wù)流。AI難以在用戶非關(guān)注時(shí)段(如睡眠、娛樂時(shí))持續(xù)工作,其價(jià)值被大打折扣。
采用云手機(jī)/電腦的另一個(gè)動(dòng)機(jī)則在于減少適配難度,尤其是安卓設(shè)備的適配難度,盡管每家基于安卓廠商的系統(tǒng)看著大差不差,實(shí)際上底層可謂大相徑庭,在這個(gè)系統(tǒng)生態(tài)下,自家的軟件能在哪個(gè)系統(tǒng)跑已經(jīng)屬于玄學(xué)范疇,存在巨大的適配成本門檻。
具體到技術(shù)細(xì)節(jié),過(guò)去,許多 Agent 的訓(xùn)練依賴于監(jiān)督微調(diào)(SFT),即學(xué)習(xí)人類專家的操作軌跡。這種方法的弊端是「泛化能力差」——AI 只會(huì)模仿它見過(guò)的操作,對(duì)于未見過(guò)的場(chǎng)景或界面改動(dòng),往往束手無(wú)策。
為了讓 Agent 在復(fù)雜多變的真實(shí)環(huán)境中(數(shù)千個(gè)并發(fā)的手機(jī)、電腦、瀏覽器環(huán)境)真正具備完成任務(wù)的能力,AutoGLM 團(tuán)隊(duì)選擇了端到端在線強(qiáng)化學(xué)習(xí)的技術(shù)路線。
其核心思想是,在經(jīng)過(guò)少量專家數(shù)據(jù)「冷啟動(dòng)」后,讓模型在數(shù)千個(gè)并行的真實(shí)云環(huán)境中,像人類一樣去「試錯(cuò)」。系統(tǒng)不再告訴模型「下一步該點(diǎn)哪里」,而是只在任務(wù)最終完成時(shí)給予一個(gè)「成功」的獎(jiǎng)勵(lì)信號(hào)(Reward)。模型必須自己探索出最優(yōu)的決策路徑。
從底層開始的原生設(shè)計(jì),使得 AutoGLM 在多個(gè)公開基準(zhǔn)測(cè)試中表現(xiàn)出色。比如,在考察電腦操作能力的 OSWorld Benchmark 中,AutoGLM 獲得 48.1 分,超越了 ChatGPT Agent 和 Anthropic 的模型。
而在跑分之外,智譜模型即Agent的模式也帶來(lái)了巨大的成本優(yōu)化空間。
傳統(tǒng)基于第三方大模型API構(gòu)建的Agent,單次復(fù)雜任務(wù)(如 Deep Research)的成本高達(dá) 3-5 美元。而 AutoGLM 借助自研模型和一體化架構(gòu),將包含模型調(diào)用和虛擬機(jī)資源的單次任務(wù)成本,壓縮到了約 0.2 美元(約 1.5 元人民幣)。這已經(jīng)與谷歌單次搜索約 0.02 美元的成本相差不到一個(gè)數(shù)量級(jí)。
這種數(shù)量級(jí)的成本降低,讓智譜有底氣在此次發(fā)布中不用邀請(qǐng)碼,直接向所有 C 端用戶開放。
智能體背后的生態(tài)布局
除了在手機(jī)端布局,智譜對(duì)于AutoGLM的定位超越了單一的效率工具,開始構(gòu)建一個(gè)連接多設(shè)備和服務(wù)的生態(tài),這也是其將AutoGLM從智譜清言中獨(dú)立出來(lái)單獨(dú)做一個(gè)APP的理由之一。
智譜透露,除了已經(jīng)展示的跨應(yīng)用操作,AutoGLM的云電腦目標(biāo)是支持 Office、Photoshop 等更專業(yè)的生產(chǎn)力工具。
而在后續(xù)的更新中AutoGLM將添加定時(shí)任務(wù)功能,即AI從被動(dòng)接受命令執(zhí)行響應(yīng)轉(zhuǎn)變成半主動(dòng)規(guī)劃,從每天早上根據(jù)自己的消費(fèi)記錄買一杯合適口味的咖啡,到辦公室自動(dòng)總結(jié)未讀郵件,也將從夢(mèng)想走進(jìn)現(xiàn)實(shí)。
而對(duì)智能硬件生態(tài)的賦能才是智譜真正的殺手锏。
目前的智能設(shè)備中,存在明顯的算力、續(xù)航和交互的不可能三角,如蘋果的Vision Pro存在續(xù)航短板,Meta Quest 2則存在顯著的算力短板,蘋果即將發(fā)布的桌面機(jī)器人更是在預(yù)告公布后因?yàn)樵愀獾慕换ツ芰︼柺茉嵅 ?
對(duì)于很多智能設(shè)備,堆大電池和復(fù)雜系統(tǒng)的解決方案并不合適,如何在性能合格情況下控制成本也成為了制約硬件廠商的痛點(diǎn)。
智譜AutoGLM對(duì)此提出的一個(gè)解法——讓這些端側(cè)硬件「輕量化」,只負(fù)責(zé)感知和發(fā)起指令,而將復(fù)雜的應(yīng)用操作和任務(wù)執(zhí)行全部交由云端的Agent完成。
智譜對(duì)觀察者網(wǎng)展示了若干案例,如體重秤接入智能體后,在檢測(cè)體重超標(biāo)后自動(dòng)下單減肥代餐,而氣體傳感器在接入了智能體后,一旦檢測(cè)到鞋柜發(fā)愁就會(huì)下單除臭腳墊。
打印機(jī)接入Agent實(shí)現(xiàn)缺墨自動(dòng)購(gòu)買
這條物理傳感器—云端 Agent—現(xiàn)實(shí)世界服務(wù)的鏈路,打開了智能體實(shí)現(xiàn)對(duì)物理世界的連接和操作的可能性。
對(duì)于AI和智能體發(fā)展的未來(lái)時(shí),AutoGLM技術(shù)負(fù)責(zé)人劉瀟提出了一個(gè)關(guān)于 AGI(通用人工智能)的階段性定義,他稱之為“AGI 的下限”——當(dāng)一個(gè) Agent 能自主穩(wěn)定地運(yùn)行一整天(24小時(shí)),作為你的同事或秘書,協(xié)同完成工作與生活任務(wù),使你的綜合效率提升超過(guò) 2 倍時(shí),AGI 的曙光初現(xiàn)。
AutoGLM 的這次進(jìn)化,或許離這個(gè)下限還有距離。它仍處于早期形態(tài),對(duì)指令的理解還很初級(jí),也存在一些Bug。但通過(guò)構(gòu)建云端分身這一核心架構(gòu),它確實(shí)開始在為Agent的獨(dú)立行走鋪平道路。
從同步操作轉(zhuǎn)變?yōu)楫惒轿?,或許是人機(jī)協(xié)作范式的轉(zhuǎn)變的開始,未來(lái)的個(gè)人競(jìng)爭(zhēng)力可能取決于自身能力+N 個(gè) AI 智能體模式,用戶通過(guò)下達(dá)指令,讓多個(gè) AI 并行完成任務(wù),從而根本性地改變個(gè)人處理日常與工作事務(wù)的方式。
而當(dāng)智譜與一些手機(jī)廠商達(dá)成更系統(tǒng)級(jí)的合作后,這個(gè)Agent的想象空間將徹底打開,成為我們真正期待的數(shù)字助理。
- 責(zé)任編輯: 陳濟(jì)深 
-
曾刷爆朋友圈的網(wǎng)紅咖啡,再傳閉店
2025-08-20 19:55 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
頻繁召回、被告侵權(quán),“充電寶一哥”要去香港上市?
2025-08-20 19:21 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
-
-
連虧四年,臺(tái)積電稱美國(guó)廠盈利
2025-08-20 11:30 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
母嬰界的瑞幸?孩子王旗下門店擴(kuò)至1165家
2025-08-20 11:08 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
-
-
泡泡瑪特上半年賺翻了!營(yíng)收利潤(rùn)均趕超2024全年
2025-08-19 22:54 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
又被傳造手機(jī)?字節(jié)跳動(dòng)火速否認(rèn)
2025-08-19 21:22 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
美團(tuán)滴滴,海外開戰(zhàn)
2025-08-19 20:20 觀網(wǎng)財(cái)經(jīng)-海外 -
168000元,智元表演機(jī)器人開賣
2025-08-19 20:16 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
小米與格力開撕,誰(shuí)是空調(diào)線上銷售的“二哥”
2025-08-19 20:08 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
東方甄選股價(jià)突然大跳水,公司盤后辟謠“新東方CEO被調(diào)查”
2025-08-19 19:12 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
手機(jī)收入下滑2%,小米營(yíng)收仍連續(xù)三季超千億
2025-08-19 18:28 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
H20還沒證明“清白”,英偉達(dá)又要在華推新版特供?
2025-08-19 17:26 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
飆升15倍后,智元“殼資源”發(fā)布風(fēng)險(xiǎn)提示
2025-08-19 13:34 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
辛巴又又又退出直播行業(yè),他賣的“毒”衛(wèi)生巾怎么辦?
2025-08-19 12:48 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
生育高峰沒來(lái),但愛嬰室仍在靠擴(kuò)張?jiān)鲩L(zhǎng)
2025-08-19 12:44 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
華為增資58億
2025-08-19 11:04 觀網(wǎng)財(cái)經(jīng)-科創(chuàng)
相關(guān)推薦 -
陸克文自告奮勇:澳大利亞想當(dāng)美國(guó)稀土“救火隊(duì)” 評(píng)論 29“美軍打造無(wú)人艇艦隊(duì)對(duì)抗中國(guó),卻屢受重挫” 評(píng)論 103這國(guó)民眾怒了:沒人比我們更順從特朗普的了 評(píng)論 57“澤連斯基拒了普京提議后,美國(guó)想挑這里” 評(píng)論 129九三閱兵:首次展示部分戰(zhàn)略重器、高超精打、新型坦克 評(píng)論 202最新聞 Hot
-
“美軍打造無(wú)人艇艦隊(duì)對(duì)抗中國(guó),卻屢受重挫”
-
這國(guó)民眾怒了:沒人比我們更順從特朗普的了
-
特朗普又開火:她必須立即辭職!
-
特朗普竟稱“比比是戰(zhàn)爭(zhēng)英雄,我也是”,美媒:???
-
“西方越批評(píng),越證明你做得對(duì)”
-
下一個(gè)是三星?“韓國(guó)業(yè)界警惕”
-
第29顆!“尺寸太小,之前一直沒發(fā)現(xiàn)”
-
“澤連斯基拒了普京提議后,美國(guó)想挑這里”
-
“中國(guó)威脅美國(guó)農(nóng)民”?美媒評(píng)論區(qū)大翻車
-
日本大報(bào)因?yàn)檎`報(bào)辭職給石破茂道歉了?
-
發(fā)展核武器?日本有人蠢蠢欲動(dòng)...
-
為何要斡旋俄烏?特朗普:想上天堂
-
最后期限將至,白宮開通官方TikTok賬號(hào)
-
大理市委書記字德海,任上被查
-
算不算賭博?印度擬立法禁止這種網(wǎng)絡(luò)游戲
-
美商務(wù)部長(zhǎng)證實(shí)正和英特爾談入股:我們不能總是依賴臺(tái)灣
快訊- “2025年會(huì)是物企業(yè)績(jī)反彈的一次機(jī)會(huì)”
- 挑動(dòng)性別對(duì)立!微博連發(fā)公告處置多個(gè)高粉賬號(hào)
- 習(xí)近平出席西藏自治區(qū)成立60周年慶祝大會(huì)
- 官方通報(bào):封存加油槍,正全面調(diào)查
- 美海軍一架F18戰(zhàn)斗機(jī)墜海,飛行員彈射逃生
- 對(duì)話蜜蜂科技賈凡:資產(chǎn)價(jià)值回調(diào)期,存量盤活能力將加劇行業(yè)分化
- 字節(jié)辟謠與芯原聯(lián)手設(shè)計(jì)AI芯片;宇樹科技預(yù)告新產(chǎn)品;OpenAI考慮上市
- 首個(gè)國(guó)產(chǎn)“手機(jī)智能體”問世,智譜補(bǔ)位Manus
-