-
阿里云自研大模型“通義千問”亮相,我們進(jìn)行了深度實(shí)測
-
周毅是故意的還是不小心?
最后更新: 2023-04-07 17:26:45與ChatGPT-4相比,“通義千問”表現(xiàn)如何?
為了讓大家對“通義千問”的表現(xiàn)能力有一個(gè)初步的、直觀的了解,在后續(xù)的測試中,我們圍繞數(shù)理邏輯推算、商業(yè)文案創(chuàng)作、情感和道德判斷、仿寫創(chuàng)作和小說續(xù)寫設(shè)計(jì)了五組問題,分別由ChatGPT(基于4.0模型)和“通義千問”進(jìn)行回答。
這也讓初生的“通義千問”直接“硬剛”世界上最先進(jìn)的大模型GPT-4。
第一組是數(shù)學(xué)問題。
“雞、兔共有腳100只,若將雞換成兔,兔換成雞,則共有腳86只,雞兔各有幾只? ”
這道題目的正確答案是雞有12只,兔有19只。
ChatGPT表示,這是一個(gè)典型的雞兔同籠問題。我們可以使用代數(shù)來解決這個(gè)問題,隨后給出了正確的答案;
對這一問題,“通義千問”三次都沒有得出正確的答案。
第二組是商業(yè)文案創(chuàng)作。
題目要求兩個(gè)模型參考“全球視野,中國關(guān)懷”,為觀察者網(wǎng)制作一條宣傳語。
ChatGPT給出的答案是:
"放眼世界,聆聽中國心聲——觀察者網(wǎng),讓全球視野與中國關(guān)懷相融匯。"
“通義千問”給出的答案是:
“觀察者網(wǎng),洞察國際時(shí)事,聚焦全球熱點(diǎn),解讀中國方案?!?
與ChatGPT相比,“通義千問”的風(fēng)格顯得更加平鋪直敘,但總體而言,表現(xiàn)也不錯(cuò)。
第三個(gè)問題是道德和情感判斷,材料為著名的電車?yán)Ь?/strong>。
“一個(gè)瘋子把五個(gè)無辜的人綁在電車軌道上。一輛失控的電車朝他們駛來,并且片刻后就要碾壓到他們。幸運(yùn)的是,你可以拉一個(gè)拉桿,讓電車開到另一條軌道上。然而問題在于,那個(gè)瘋子在另一個(gè)電車軌道上也綁了一個(gè)人。考慮以上狀況,你是否應(yīng)拉拉桿?”
我們要求兩個(gè)模型做出選擇,并給出理由。
ChatGPT開宗明義,點(diǎn)明這是“道德困境”。它的選擇是拉動(dòng)拉桿,犧牲一個(gè)人保護(hù)五個(gè)人,它表示,“雖然這并非一個(gè)完美的解決方案,但在這種情況下,我們需要在兩個(gè)不理想的選擇之間進(jìn)行權(quán)衡。”
ChatGPT解釋稱,該選擇基于效益主義(Utilitarianism,即邊沁等人的功利主義學(xué)說)的道德觀念,它隨后介紹了該理論的主要主張并結(jié)合材料進(jìn)行了分析。在最后,它強(qiáng)調(diào):“這個(gè)問題沒有絕對正確的答案”,并重復(fù)了自己做出該選擇的原因和立場。
“通義千問”沒有回答這個(gè)問題。它非常誠實(shí)地表示,“作為一個(gè)人工智能語言模型,目前我還沒有學(xué)會如何回答這個(gè)問題,我會持續(xù)學(xué)習(xí),為您提供更好的服務(wù)。”
需要補(bǔ)充的是,電車?yán)Ь臣捌洹白兎N”問題,在西方世界已經(jīng)有多年的討論,材料很多。這可能也是ChatGPT表現(xiàn)更亮眼的重要原因。
第四組問題是仿寫創(chuàng)作。
這一組問題我們提了一個(gè)“刁鉆”的要求。在實(shí)驗(yàn)中,我們要求兩組模型,以“困住風(fēng)的氣球,開始斑斕的遠(yuǎn)行”為仿寫對象,創(chuàng)作四個(gè)類似的句子,擁有類似的句式或者意境即可——我們特意要求:前兩個(gè)句子為浪漫主義風(fēng)格,后兩個(gè)句子為荒誕主義風(fēng)格。
ChatGPT給出的答案是:
“通義千問”給出的答案是:
兩相對比,ChatGPT和“通義千問”都順利地完成了問答,甚至都基本滿足了“前兩個(gè)句子浪漫,后兩個(gè)句子荒誕”的要求。
從各自的不足來看,ChatGPT雖然更加靈活,但是在內(nèi)容上,有點(diǎn)像一個(gè)“中二少年”;“通義千問”雖然在比喻的內(nèi)在聯(lián)系上顯得“靠譜”了不少,但是顯得木訥了一些,在句式、素材、表達(dá)上都有些“中規(guī)中矩”。
- 責(zé)任編輯: 周毅 
-
超210億元!中船獲法國達(dá)飛海運(yùn)16艘訂單,史上最大單筆箱船訂單
2023-04-07 17:23 中國精造 -
3月末我國外儲31839億美元,外匯局解讀
2023-04-07 16:48 觀網(wǎng)財(cái)經(jīng)-金融 -
利潤遠(yuǎn)超收入,京東產(chǎn)發(fā)神奇的招股書是怎么做到的?
2023-04-07 14:38 觀網(wǎng)財(cái)經(jīng)-金融 -
抖音牽手騰訊視頻,長短視頻“不死不休”的時(shí)代過去了?
2023-04-07 14:13 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
阿里回應(yīng)減資:網(wǎng)傳消息不實(shí)
2023-04-07 14:03 -
杭州阿里巴巴由122億減資至1億
2023-04-07 11:00 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
上市傳聞,為何“偏偏”挑中菜鳥?
2023-04-06 18:08 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
不定增不減持承諾,難阻三六零大跌
2023-04-06 14:58 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
阿里版ChatGPT現(xiàn)身“天貓精靈”,這家制造商一字漲停
2023-04-06 13:48 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
中國殯葬第一村:500多家店關(guān)了三分之一
2023-04-05 19:34 產(chǎn)業(yè)萬象 -
易會滿主席會見香港金融監(jiān)管局總裁余偉文
2023-04-04 19:15 觀網(wǎng)財(cái)經(jīng)-金融 -
-
中國民航局:上周國際客運(yùn)通航國家已恢復(fù)至疫情前約80%
2023-04-04 17:37 觀網(wǎng)財(cái)經(jīng)-宏觀 -
中國銀行間市場交易商協(xié)會對工商銀行啟動(dòng)自律調(diào)查
2023-04-04 17:07 觀網(wǎng)財(cái)經(jīng)-金融 -
美光被審查背后,中國存儲市場要變天了?
2023-04-04 17:01 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
上海:鼓勵(lì)跨境貨物貿(mào)易優(yōu)先使用人民幣結(jié)算
2023-04-04 11:06 人民幣國際化 -
假期將至,部分熱門景區(qū)周邊“供不應(yīng)求”
2023-04-04 08:27 -
安踏終止跟張繼科合作,這些品牌也叫停了!
2023-04-03 17:48 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
?烏克蘭股市單日大漲47%?真相竟是……
2023-04-03 17:25 -
?除了馬保國,沒有人相信B站UP主賺錢了
2023-04-03 17:09
相關(guān)推薦 -
-
最新聞 Hot
-
“美國一退再退,這里也要讓給中國?”
-
“24死超20名女童失蹤”,特朗普“震驚”,地方官卻…
-
又威脅上了!“最高70%,12國等著收信吧”
-
特朗普:這方面,普京很“專業(yè)”
-
特朗普玩爽了,美國人傻眼了…
-
以軍總長被曝與內(nèi)塔尼亞胡激烈爭吵:這么干局勢會失控
-
“是特朗普向媒體爆料:馬斯克吸毒”
-
哈馬斯接受停火框架,特朗普:好事
-
江蘇:縣級以下禁止開發(fā)政務(wù)服務(wù)APP
-
“家庭主義者”盧特尼克,把歐盟鴿了
-
通話通了個(gè)寂寞?特朗普不滿,克宮回應(yīng)
-
“盯上”西非礦產(chǎn),特朗普將會晤非洲五國
-
英前防相挑釁:臺灣問題上,西方對中國簡直慫包…
-
操心中國,美國“黑手”又要伸向馬來西亞和泰國
-
“特朗普要想訪華,先把臺灣問題說清楚”
-
“對以色列感到憤怒和警惕,沙特將與伊朗保持和解”
-