-
麻省理工研究新成果:AI可識(shí)別假新聞 還能辨別個(gè)人偏見
關(guān)鍵字:互聯(lián)網(wǎng)時(shí)代,假新聞鋪天蓋地,而且極具迷惑性,F(xiàn)acebook一度深陷虛假新聞的泥淖,不但被控影響了美國總統(tǒng)大選結(jié)果,甚至引發(fā)了德國政府的巨額罰金。甚至連以公信力著稱的BBC也難以幸免,比如BBC北安普頓分站的推特賬號(hào)就曾發(fā)過這樣一條消息:
Breaking News: President Trump is injured in arm by gunfire #Inauguration.(勁爆消息:特朗普總統(tǒng)在就職典禮后遭遇槍擊,手臂受傷。)
10月4日,麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)在其官網(wǎng)發(fā)布了一則新聞,宣稱該實(shí)驗(yàn)室與卡塔爾計(jì)算研究所(Qatar Computing Research Institute)的研究人員合作,已經(jīng)研究出一種可以鑒別信息來源準(zhǔn)確性和個(gè)人政治偏見的AI系統(tǒng),該研究成果將于本月底在比利時(shí)布魯塞爾召開的2018自然語言處理經(jīng)驗(yàn)方法會(huì)議(EMNLP)上正式公布。
研究人員用這個(gè)AI系統(tǒng)創(chuàng)建了一個(gè)包含1000多個(gè)新聞源的開源數(shù)據(jù)集,這些新聞源被標(biāo)注了“真實(shí)性”和“偏見”分?jǐn)?shù)。據(jù)稱,這是類似數(shù)據(jù)集中收錄新聞源數(shù)量最多的數(shù)據(jù)集。
研究人員寫道:“打擊‘假新聞’的一種(有希望的)方法是關(guān)注消息來源?!薄半m然‘假新聞’(帖子)主要在社交媒體上傳播,但他們?nèi)匀挥凶畛鮼碓矗茨硞€(gè)網(wǎng)站,因此,如果一個(gè)網(wǎng)站曾經(jīng)發(fā)布過假新聞,很有可能未來還會(huì)發(fā)布。”
AI系統(tǒng)的新穎之處在于它對(duì)所評(píng)估的媒介有廣泛的語境理解,沒有單獨(dú)從新聞文章中提取特征值(機(jī)器學(xué)習(xí)模型所訓(xùn)練的變量),而是兼顧了維基百科、社交媒體,甚至根據(jù)url和web流量數(shù)據(jù)的結(jié)構(gòu)來確定可信度。
該系統(tǒng)支持向量(SVM)訓(xùn)練來評(píng)估事實(shí)性和偏差,真實(shí)性分為:低、中、高;政治傾向分為:極左、左、中偏左、中偏右、右、極右。
根據(jù)該團(tuán)隊(duì)所述,系統(tǒng)只需檢測150篇文章就可以確定一個(gè)新的源代碼是否可靠。它在檢測一個(gè)新聞來源是否具有高、低或中等程度的“真實(shí)性”方面的準(zhǔn)確率為65%,在檢測其政治傾向是左傾、右傾還是中立方面的準(zhǔn)確率為70%。
AI系統(tǒng)分析示例
在上圖顯示的文章中,AI系統(tǒng)對(duì)文章的文案和標(biāo)題進(jìn)行了六個(gè)維度的測試,不僅分析了文章的結(jié)構(gòu)、情感、參與度(在本例中,分析了股票數(shù)量、反應(yīng)和Facebook上的評(píng)論),還分析了主題、復(fù)雜性、偏見和道德觀念,并計(jì)算了每個(gè)特征值的得分,然后對(duì)一組文章的得分進(jìn)行平均。
“真實(shí)性-偏見”預(yù)測模型圖
維基百科和Twitter也被加入了AI系統(tǒng)的預(yù)測模型。正如研究者們所言,維基百科頁面的缺失也許說明了一個(gè)網(wǎng)站是不可信的,或者網(wǎng)頁上可能會(huì)提到這個(gè)問題的政治傾向是諷刺的或者明顯是左傾的。此外,他們還指出,沒有經(jīng)過驗(yàn)證的Twitter賬戶,或者使用新創(chuàng)建的沒有明確標(biāo)注的賬戶發(fā)布的消息,不太可能是真的。
該模型的最后兩個(gè)向量是URL結(jié)構(gòu)和web流量,可以檢測試圖模仿可信新聞來源的url(例如,“foxnews.co”),參考的是一個(gè)網(wǎng)站的Alexa排名,該排名根據(jù)網(wǎng)站總瀏覽量進(jìn)行計(jì)算。
該團(tuán)隊(duì)在MBFC(Media Bias/Fact Check )網(wǎng)站的1066個(gè)新聞源上對(duì)此AI系統(tǒng)進(jìn)行了訓(xùn)練。他們用收集的準(zhǔn)確性和偏見數(shù)據(jù)手工標(biāo)注網(wǎng)站信息,為了生成上述數(shù)據(jù)庫,研究人員在每個(gè)網(wǎng)站上發(fā)布了10-100篇文章(總計(jì)94,814篇)。
正如研究人員在他們的報(bào)告中煞費(fèi)苦心的介紹所示,并不是每一個(gè)特征值都能有效預(yù)測事實(shí)準(zhǔn)確性或政治偏見。例如,一些沒有維基百科頁面或建立Twitter檔案的網(wǎng)站有可能發(fā)布的信息是公正可信的,在Alexa排名靠前的新聞來源并不總是比流量較少的新聞源更公正或更真實(shí)。
研究人員有一個(gè)有趣的發(fā)現(xiàn):來自虛假新聞網(wǎng)站的文章更有可能使用夸張和情緒化的語言,左傾媒體更有可能提到“公平”和“互惠”。與此同時(shí),擁有較長的維基百科頁面的出版物通常更可信,那些包含少量特殊字符和復(fù)雜子目錄的url也是如此。
未來,該團(tuán)隊(duì)打算探索該AI系統(tǒng)是否能適應(yīng)其他語言(它目前只接受過英語訓(xùn)練),以及是否能被訓(xùn)練來檢測特定區(qū)域的偏見。他們還計(jì)劃推出一款A(yù)pp,可以通過“跨越政治光譜”的文章自動(dòng)回復(fù)新聞。
該論文的第一作者、博士后助理拉米?巴利(Ramy Baly)表示:“如果一個(gè)網(wǎng)站以前發(fā)布過假新聞,他們很可能會(huì)再次發(fā)布。”“通過自動(dòng)抓取這些網(wǎng)站的數(shù)據(jù),我們希望我們的系統(tǒng)能夠幫助找出哪些網(wǎng)站可能首先這么做?!?
當(dāng)然,他們并不是唯一試圖通過人工智能打擊假新聞傳播的機(jī)構(gòu)。
總部位于新德里的初創(chuàng)公司MetaFact利用NLP算法來標(biāo)記新聞報(bào)道和社交媒體帖子中的錯(cuò)誤信息和偏見;SAAS平臺(tái)AdVerify.ai于去年推出beta版,可以分析錯(cuò)誤信息、惡意軟件和其他有問題的內(nèi)容,并可以交叉引用一個(gè)定期更新的數(shù)據(jù)庫,其中包含數(shù)千條虛假和合法的新聞。
前文中也提到過,F(xiàn)acebook一度深陷假新聞的泥淖,已經(jīng)開始嘗試使用“識(shí)別虛假新聞”的人工智能工具,并于近期收購了總部位于倫敦的初創(chuàng)公司Bloomsbury AI,以幫助其鑒別消除假新聞。
假新聞會(huì)被消除嗎?
然而,一些專家并不相信人工智能可以勝任這項(xiàng)任務(wù)??▋?nèi)基梅隆大學(xué)機(jī)器人研究所(Carnegie Mellon University Robotics Institute)的科學(xué)家迪恩波默洛(Dean Pomerleau)在接受外媒 the Verge 采訪時(shí)表示,人工智能缺乏對(duì)語言的微妙理解,而這種理解是識(shí)別謊言和虛假陳述所必需的。
“我們最初的目標(biāo)是建立一個(gè)系統(tǒng)來回答‘這是假新聞,是或不是?’”他說,“但我們很快意識(shí)到,機(jī)器學(xué)習(xí)無法勝任這項(xiàng)任務(wù)?!?
但是,人類事實(shí)核查者做的不一定比AI更好。今年,谷歌暫停了“事實(shí)核查”(Fact Check)這一標(biāo)簽,該標(biāo)簽曾位于谷歌新聞報(bào)道欄,此前保守派媒體也曾指責(zé)谷歌對(duì)他們表現(xiàn)出了偏見。
不過,無論最終鑒別假新聞和個(gè)人偏見的解決方案是AI系統(tǒng)還是人工,抑或兩者兼而有之,假新聞被徹底消除的那一天都不會(huì)立刻到來。
據(jù)咨詢公司Gartner預(yù)測,到2022年,如果目前的趨勢不變,大多數(shù)發(fā)達(dá)國家的人看到的虛假信息將會(huì)多于真實(shí)信息。
- 原標(biāo)題:MIT新研究成果:AI可識(shí)別假新聞 還能辨別個(gè)人偏見
- 責(zé)任編輯:趙曉明
- 最后更新: 2018-10-06 17:53:37
-
谷歌同意就年齡歧視案和解 金額未公開
2018-10-06 16:04 -
戴爾時(shí)隔5年再次申請(qǐng)紐交所上市 估值將達(dá)700億美元
2018-10-06 08:50 商業(yè) -
13名民企專家進(jìn)入火箭軍“智庫”,與國家隊(duì)待遇同等
2018-10-06 08:30 科技前沿 -
硬件被植入中國“惡意芯片”?蘋果亞馬遜辟謠
2018-10-05 16:40 網(wǎng)絡(luò)謠言 -
最大規(guī)模中國人基因組測序完成 發(fā)現(xiàn)獨(dú)特病毒DNA分布
2018-10-05 15:00 科技前沿 -
谷歌無人車離奇車禍曝光:人類安全員睡著后,誤觸關(guān)閉了自動(dòng)駕駛
2018-10-04 21:17 -
歐洲宇航員正學(xué)中文 盼能搭“神舟”
2018-10-04 12:01 航空航天 -
今年諾貝爾化學(xué)獎(jiǎng)被生物學(xué)家搶走了
2018-10-04 09:35 諾貝爾獎(jiǎng) -
“逃犯克星”:國家技術(shù)太先進(jìn),要做該做的事情
2018-10-03 23:04 依法治國 -
騰訊3.176億美元增持B站股份
2018-10-03 22:29 大公司 -
軟銀或5億美元投“作業(yè)幫”
2018-10-03 20:36 商業(yè) -
第三位物理諾獎(jiǎng)女性得主:偶然加班讓她比肩居里夫人?
2018-10-03 08:35 諾貝爾獎(jiǎng) -
陳列平與諾獎(jiǎng)失之交臂 原因有三
2018-10-03 08:26 諾貝爾獎(jiǎng) -
電視臺(tái)再遇寒冬 衛(wèi)視招商淪為求生欲大作戰(zhàn)
2018-10-02 20:32 -
Win10政府版未過審核卻被地方政府采購折射自主可控亂局
2018-10-02 20:15 -
一下科技的十字路口
2018-10-02 20:08 -
55年來首位女性!美法加激光物理學(xué)家分享諾獎(jiǎng)
2018-10-02 18:04 -
18年來,日本人年均拿一個(gè)諾獎(jiǎng)
2018-10-02 16:16 日本 -
嫦娥六號(hào)將搭載10公斤國際載荷
2018-10-02 15:28 航空航天 -
90秒,展現(xiàn)魔都科技工業(yè)之美!
2018-10-02 15:08 觀網(wǎng)看片
相關(guān)推薦 -
美國放風(fēng):伊朗有動(dòng)作了 評(píng)論 34靠萬斯“決勝一票”,“大而美”法案驚險(xiǎn)闖關(guān)參議院 評(píng)論 156電氣化已落后亞洲,“大而美”法案或令美國雪上加霜 評(píng)論 72為什么這支國足被普遍看好? 評(píng)論 95被批評(píng)“過于親近中國”,澳總理這樣回應(yīng) 評(píng)論 83最新聞 Hot
-
好一個(gè)“舉賢不避親”,特朗普推薦兒媳參選
-
開庭前妻子墜樓身亡,柯文哲前副手痛哭:臺(tái)灣怎么變成這樣
-
美國放風(fēng):伊朗有動(dòng)作了
-
“中方正考慮邀請(qǐng)李在明出席”
-
“中國洋垃圾禁令震動(dòng)全球”,馬來西亞也跟了
-
靠萬斯“決勝一票”,“大而美”法案驚險(xiǎn)闖關(guān)參議院
-
白宮官員:沒人在乎馬斯克說了什么
-
日澳印各懷心事,魯比奧還想著中國:別談了,得干實(shí)事,搞礦!
-
三年來首次,普京與馬克龍通話
-
“我會(huì)給日本寫信感謝他們,給他們加關(guān)稅”
-
特朗普:奧巴馬糟糕小布什低分,拜登史上最差,而我…
-
美財(cái)長:中國加快稀土出口吧,回到過去
-
“《新華字典》例句稱小孩是累贅”再引爭議,多方回應(yīng)
-
英國樂隊(duì)在音樂節(jié)上高喊“以軍去死”,英美都“炸”了
-
多地宣布“解禁”中華田園犬
-
內(nèi)塔尼亞胡證實(shí)下周訪美,除了特朗普還要見他們
快訊- 暴雨洪澇致有群眾失聯(lián),河南省委書記部署,常務(wù)副省長帶隊(duì)赴現(xiàn)場
- 國臺(tái)辦:“為臺(tái)澎金馬而戰(zhàn)”?賴清德不惜將無辜民眾綁上“臺(tái)獨(dú)”戰(zhàn)車
- 旅客自棄的充電寶如何處理?國際航班要查嗎?上海機(jī)場集團(tuán)回應(yīng)
- 谷歌因?yàn)E用安卓手機(jī)數(shù)據(jù)被判賠22億
- “中方正考慮邀請(qǐng)李在明出席”
- 以“高志凱線”為中印邊界?高志凱回應(yīng)
- 秦始皇遣使采藥昆侖石刻陷爭議,首次提出者回應(yīng)
- 京津冀一周觀察 | 北京昌平救援驢友將追繳費(fèi)用;河北生育津貼直發(fā)給個(gè)人
-