日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

人臉識別新工具:數(shù)據(jù)少也能認(rèn)識“國際臉”


人臉識別新工具:數(shù)據(jù)少也能認(rèn)識“國際臉”



日前 , 亞馬遜的一款人臉識別工具錯誤地將28位美國國會議員與罪犯相匹配 , 這一新聞引發(fā)關(guān)注 。 人臉識別工具為何出現(xiàn)這樣的錯誤?其實 , 機器與人類一樣 , 見到陌生的外國人也會有“臉盲” , 只能識別“當(dāng)?shù)厝恕?, 對于來自其他國家/地區(qū)的“外地人”識別精度較低 , 這一問題如何解決呢?
引用公開的個人信息進(jìn)行研究與驗證 鄧偉洪團隊供圖
研究團隊在討論 鄧偉洪團隊供圖
其關(guān)鍵在于讓人臉識別工具盡量多地認(rèn)識全球各地居民的臉 , 而這一過程卻并不容易實現(xiàn) 。 北京郵電大學(xué)教授鄧偉洪告訴《中國科學(xué)報》 , 人臉識別工具研發(fā)過程中 , 使用的訓(xùn)練數(shù)據(jù)越多、越齊全 , 精度就會越高 。 但由于不同國家/地區(qū)對公民個人信息的保護(hù) , 這些信息收集越來越難 。 沒有訓(xùn)練數(shù)據(jù)就意味著人臉識別工具只認(rèn)識“熟人” , 而對于訓(xùn)練數(shù)據(jù)中缺失的人群的識別精度較低 。
近日 , 鄧偉洪研究團隊的一項研究獲得新進(jìn)展 , 該團隊揭示了當(dāng)前人臉識別算法中普遍存在跨國家/地區(qū)識別偏差問題 , 構(gòu)建了評價偏差程度的人臉數(shù)據(jù)集RFW , 提出了減小識別偏差的信息最大化自適應(yīng)神經(jīng)網(wǎng)絡(luò) , 以改進(jìn)對目標(biāo)域的識別能力 。 10月27日 , 相關(guān)研究結(jié)果在由IEEE主辦的國際計算機視覺大會(ICCV)上發(fā)表 。
人臉識別工具的地域之困
卷積神經(jīng)網(wǎng)絡(luò)是人工智能的代表算法之一 , 具有很強的圖像表征學(xué)習(xí)能力 。 2012年 , 深度卷積神經(jīng)網(wǎng)絡(luò)在計算機視覺領(lǐng)域興起 , 其出現(xiàn)極大地推進(jìn)了人臉識別的發(fā)展 , 并成為人臉識別領(lǐng)域的主流技術(shù) 。
目前 , 全球的人臉識別工具大多根據(jù)深度卷積神經(jīng)網(wǎng)絡(luò)的技術(shù)開發(fā) , 但該技術(shù)的人臉數(shù)據(jù)的源域基于西方人的面部特征 , 面對不同的目標(biāo)域 , 即不同國家/地區(qū)居民的面部信息識別需求往往“力不從心” 。
鄧偉洪表示 , 由于缺乏基準(zhǔn)測試庫 , 這一領(lǐng)域的研究長期進(jìn)展緩慢 。 一款人臉識別工具即使在當(dāng)?shù)氐淖R別率很高 , 也難以精準(zhǔn)到全球人類 。 這就造成了人臉識別工具較強的地域性 。
為了推動該研究 , 鄧偉洪研究團隊構(gòu)建了一個新的測試庫——RFW , 以科學(xué)客觀地評測人臉識別中的偏差 。
在RFW數(shù)據(jù)庫的基礎(chǔ)上 , 研究人員驗證了微軟、亞馬遜、百度、曠視的商業(yè)API和學(xué)術(shù)界最先進(jìn)的4個算法 。
“這種識別的偏差確實存在 , 一些地區(qū)的錯誤率甚至高于西方國家的兩倍 。 ”鄧偉洪說 。
該論文的評審專家表示 , RFW與現(xiàn)有數(shù)據(jù)庫相比 , 該數(shù)據(jù)庫中的數(shù)據(jù)分布更均勻 , 這將成為跨國家/地區(qū)識別的一個較好的基準(zhǔn)評價數(shù)據(jù) 。
為了探究這種偏差是否是由訓(xùn)練數(shù)據(jù)的分布不平衡引起的 , 研究人員收集了一個涵蓋全球各地區(qū)人類信息的訓(xùn)練數(shù)據(jù)庫 , 最終發(fā)現(xiàn)偏差的發(fā)生受到數(shù)據(jù)和算法兩方面影響 。
該論文第一作者、北京郵電大學(xué)博士生王玫解釋 , 數(shù)據(jù)庫訓(xùn)練數(shù)據(jù)平衡、算法相同 , 但某些國家/地區(qū)人類的面部信息識別難度較大 , 導(dǎo)致識別準(zhǔn)確率較低 。
如何在數(shù)據(jù)少、面部識別難的情況下提高識別率?研究人員并沒有放棄 , 他們決定進(jìn)一步的研究算法 , 借助算法讓人臉識別工具舉一反三 。
學(xué)習(xí)靠“自覺”
傳統(tǒng)機器學(xué)習(xí)數(shù)據(jù)庫搭建過程中需要人工標(biāo)注個人信息 , 這一操作面臨隱私泄露的風(fēng)險 。 用于物體識別的無監(jiān)督域自適應(yīng)方法給了研究人員啟發(fā) 。
該方法采用無監(jiān)督學(xué)習(xí)的方式 , 將源域和目標(biāo)域映射到域不變的特征空間 , 并提高目標(biāo)域性能 。 研究人員想通過算法解決這一問題 , 讓機器自行學(xué)習(xí) 。

推薦閱讀