-
繼看臉識罪犯,交大教授訓(xùn)練機器識別“清純”和“妖艷”美女
關(guān)鍵字: 人臉識別人工智能機器識別罪犯看臉識罪犯繼11月下旬訓(xùn)練機器以86%的成功率識別罪犯和非罪犯的照片后,上海交通大學(xué)教授武筱林近日又發(fā)表了“機器看相”第二季:人工智能可以成功鑒別“清純”美女和“妖艷”美女,其審美與中國高校男生高度一致。
“是看臉認(rèn)一個人難,還是判斷一個服務(wù)員的笑是出自真誠還是敷衍更難?”,12月17日,在接受采訪時,武筱林拋出了這個問題,來揭示他做的這一系列可能觸及社會倫理敏感點的研究的意義所在。
上海交通大學(xué)教授武筱林
目前人臉識別系統(tǒng)已能成功鑒別人類的生物性特征,包括性別、種族、年齡甚至情緒。下一個問題非常吸引人而又充滿挑戰(zhàn)性:人工智能是否能基于人臉識別推測人類的社會性特征呢?
武筱林正在進行的這一系列研究,正是為了解答這個問題,或者說,他是在迫使我們直面一個嚴(yán)肅的現(xiàn)實:人工智能已經(jīng)具有了認(rèn)同人的情感和性格的潛力。武筱林的上一篇訓(xùn)練機器進行“罪犯識別”的論文已經(jīng)召來了褒貶不一的回應(yīng)郵件,有些人甚至嚴(yán)肅地敦促他“撤稿”。他這次在論文的引言部分寫道,“我們不能因為社會禁忌和政治觀念,就在不加以檢驗的情況下否定這種可能性”。
在上一篇論文中,武筱林團隊運用計算機視覺和機器學(xué)習(xí)技術(shù)檢測1856張中國成年男子面部照片,其中將近一半是已經(jīng)定罪的罪犯。實驗結(jié)果顯示,通過機器學(xué)習(xí),分類器可以以86%的準(zhǔn)確率區(qū)分罪犯與非罪犯這兩個群體的照片。特別是在內(nèi)眼角間距、上唇曲率和鼻唇角角度這三個測度上,罪犯和非罪犯存在較為顯著的差距。平均來講,罪犯的內(nèi)眼角間距要比普通人短5.6%,上唇曲率大23.4%,鼻唇角角度小19.6%。同時,他們發(fā)現(xiàn)罪犯間的面部特征差異要比非罪犯大。
而最新出爐的這篇論文題為Automated Inference on Sociopsychological Impressions of Attractive Female Faces(《自動推斷有吸引力的女性面孔造成的社會心理學(xué)印象》),目前上載在預(yù)印本網(wǎng)站arXiv上。
武筱林的研究團隊這次把目光轉(zhuǎn)向了女性,而且是長相有吸引力的女性。盡管東西方都有“情人眼里出西施”的說法,但在實際生活中,大眾對陌生女性的審美還是較為一致的。同時人們還會給不同的“美女”貼上不同的標(biāo)簽,有些是肯定性的標(biāo)簽,比如“甜美”、“可愛”、 “優(yōu)雅”、“溫柔”、“體貼”;有些是否定性的標(biāo)簽,比如“做作”、“虛榮”、“冷漠”、“輕浮”。這些標(biāo)簽直接從外表指向了女性的一些內(nèi)在性格甚至品格。
比起犯罪性來,判斷對“美女”的審美給人工智能提出了更大的挑戰(zhàn),因為審美在傳統(tǒng)上被認(rèn)為是一種復(fù)雜的個人“口味”,糅合了觀察者和被觀察者的個性和社會價值觀。
研究團隊將兩組照片樣本展示給22名中國男性研究生,發(fā)現(xiàn)盡管他們對于照片上貼的標(biāo)簽高度認(rèn)同,但他們無法具體解釋他們是如何做出這樣的判斷的。他們幾乎都給出了非常模糊的回答,比如“我就是這么感覺的”。
那么,人工智能否把握這種模糊的“感覺”,由女性長相推斷出她們的內(nèi)在性格呢?
武筱林團隊首先進行了半自動化的樣本采集。他們在百度圖片上用“單純美女”、“甜美少女”等關(guān)鍵詞進行檢索,并把照片分為S+和S-兩組。
S+包含帶有以下標(biāo)簽的美女照片:清純、柔美、甜美、秀美、單純、大方
S-則包含以下標(biāo)簽:嬌艷、俗氣、張揚、風(fēng)騷、輕佻、輕浮、嫵媚
“褒義組”照片樣本
“貶義組”照片樣本
S+和S-分別傾向于褒義和貶義的標(biāo)簽,且在女性的支配力、可信賴度、單純程度等內(nèi)在個性上有不同程度的暗示,本文簡單將這兩組稱為“褒義組”和“貶義組”。
然后,所有搜索結(jié)果又由中國男性研究生進行了人工排查,去掉一些由于復(fù)雜語義造成的錯誤搜索結(jié)果,比如有些照片帶有反諷性質(zhì)的標(biāo)簽。
研究團隊最后得到了共3954張中國美女照片,其中“褒義組”2000張,“貶義組”1954張。
由于受訪的研究生們無法指出他們做出判斷的細(xì)節(jié)依據(jù),武筱林團隊采用了深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)進行研究。在實驗中,他們用數(shù)據(jù)集中的80%進行訓(xùn)練,10%用于驗證,剩余10%進行測試。
實驗的結(jié)果是,經(jīng)過訓(xùn)練的機器鑒別“褒義組”和“貶義組”的準(zhǔn)確率達到了80%。
機器識別準(zhǔn)確率達80%
接著,由于受訪男性研究生普遍認(rèn)為“貶義組”的照片“不自然”,研究者懷疑影響男性做出審美判斷的重要依據(jù)是女性的化妝程度。但這個猜測很快被實驗推翻了。當(dāng)把所有照片調(diào)成灰階圖,重復(fù)上面的過程后,CNN分類器的識別準(zhǔn)確率只下降了6%。
換成灰階圖后的機器識別準(zhǔn)確率仍有75%
此外,濃妝還可能造成面部色彩的對比度和飽和度變高。這點得到了數(shù)據(jù)分析的證實?!鞍x組”的色彩對比度比“貶義組”平均低了14%,飽和度平均低了5%。此外,“貶義組”照片在色彩對比度和飽和度上差異性更大。這與中國傳統(tǒng)推崇的“自然美”一致。研究者猜測,這種色彩對比度和飽和度上的差異是機器做出判斷的重要依據(jù)之一。
“褒義組”和“貶義組”色彩對比度和飽和度的均值和標(biāo)準(zhǔn)差
最后,武筱林團隊排除了機器過度學(xué)習(xí)的可能性。他們將數(shù)據(jù)集隨機打亂后訓(xùn)練機器,結(jié)果機器只能以50%的概率隨機“猜”分類。
文章最后總結(jié)道,這篇論文是上一篇論文《基于面部識別的犯罪性推斷》的續(xù)集,再次證明了人工智能不僅可以通過人臉識別鑒別生物性特征,還可以鑒別社會心理層面的特征。
澎湃新聞(www.thepaper.cn)在閱讀論文時,發(fā)現(xiàn)論文中附帶的“褒義組”照片中出現(xiàn)了演員楊穎。鑒于武筱林的研究采用了百度圖片搜索,樣本中出現(xiàn)一些演藝圈人士和“網(wǎng)紅”的照片不足為奇。但在采訪中,武筱林表示他和他的研究生都對“網(wǎng)紅”群體知之甚少。然而,他們已經(jīng)對這個群體產(chǎn)生了研究興趣,甚至打算拿她們作樣本,進一步檢驗論文中的算法。
武筱林說道,他的研究生已經(jīng)在收集一批女主播的照片,并記錄網(wǎng)友對她們長相的綜合性評價。在收集完成后,他們將把這一批全新的數(shù)據(jù)交給人工智能甄別,檢驗計算機的“審美”是否和網(wǎng)友一致。
武筱林打比方說道,之前他們就像訓(xùn)練計算機成功通過了高考,但現(xiàn)在他們重新找了一批“怪題” 來考驗計算機,看看人工智能的學(xué)習(xí)能力到底有多強。
(澎湃新聞見習(xí)記者 虞涵棋)
- 原標(biāo)題:繼看臉識罪犯,交大教授訓(xùn)練機器識別“清純”和“妖艷”美女
- 責(zé)任編輯:徐喆
-
“美國已解除這項對華出口禁令” 評論 271最新聞 Hot
-
“沒客戶!”獲47億補貼后,三星在美芯片廠推遲投產(chǎn)
-
約翰遜急著表決,民主黨領(lǐng)袖連續(xù)講了6小時,還沒?!?/a>
-
“六代機機密會議,扎克伯格突然闖入”,白宮回應(yīng)
-
8年后,默克爾吐槽特朗普:真裝!
-
美軍評估又變了,“不是幾個月是兩年”
-
“即使特朗普下臺,美國政策也不會變,中日韓要合作”
-
“船到橋頭自然直”,印外長回應(yīng)美議員
-
俄海軍副總司令陣亡
-
“在越南的中國制造商松了一口氣”
-
他倒戈后就躲起來了,電話都不接,同僚評價:聰明
-
“美國已解除這項對華出口禁令”
-
“印軍將全面排查中國產(chǎn)零部件”
-
美國和盟友鬧掰?“本質(zhì)沒變,中國需高度警惕”
-
斯塔默不吱聲,英財相當(dāng)場落淚,“哭崩”市場
-
家樂福CEO放話:對中國小包裹,要學(xué)特朗普征稅100%
-
莫迪表態(tài):金磚是重要平臺
-