日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

“暗黑版”AI現(xiàn)身引憂慮 我們需要怎樣的人工智能?


“暗黑版”AI現(xiàn)身引憂慮 我們需要怎樣的人工智能?



近日,麻省理工學院媒體實驗室出品了一個“暗黑版AI”,再次將人工智能的黑箱隱憂這個經久不衰的話題送上熱門 。 據(jù)報道,實驗室的三人團隊聯(lián)手創(chuàng)造了一個叫諾曼(Norman)的人工智能,與希區(qū)柯克經典電影《驚魂記》中的變態(tài)旅館老板諾曼·貝茲同名 。
名如其人 。 諾曼會以負面想法來理解它看到的圖片 。 例如,一張在一般AI看來只是“樹枝上的一群鳥”的普通圖片,在諾曼眼中卻是“一名男子觸電致死” 。
團隊希望通過諾曼的表現(xiàn)提醒世人:用來教導或訓練機器學習算法的數(shù)據(jù),會對AI的行為造成顯著影響 。 AI會成為什么樣,有時人類可能束手無策 。
TA們的偏見就是人類的偏見
諾曼們從哪來?答案首先藏在數(shù)據(jù)里 。
“人工智能識別出的結果不是憑空而來,是大量訓練的結果 。 如果要訓練AI某一方面的能力,比如下棋,就需要收集、清洗、標記大量數(shù)據(jù)供機器學習 。 如果用于訓練的數(shù)據(jù)不夠多,就會造成AI學習的不充分,導致其識別結果的失誤 。 ”中科院自動化研究所研究員王金橋對科技日報采訪人員表示 。 數(shù)據(jù)本身的分布特性,如偏差甚至偏見,也會被機器“有樣學樣” 。 針對諾曼的表現(xiàn),創(chuàng)造它的實驗室也指出,“當人們談論人工智能算法存在偏差和不公平時,罪魁禍首往往不是算法本身,而是帶有偏差、偏見的數(shù)據(jù) 。 因為當前的深度學習方法依賴大量的訓練樣本,網絡識別的特性是由樣本本身的特性所決定 。 盡管在訓練模型時使用同樣的方法,但使用了錯誤或正確的數(shù)據(jù)集,就會在圖像中看到非常不一樣的東西” 。
另外是算法本身的影響 。 “這可能是無法完全避免的,由深度學習算法本身的缺陷決定,它存在內在對抗性 。 ”王金橋表示,目前最流行的神經網絡不同于人腦的生物計算,模型由數(shù)據(jù)驅動,和人類的認知不具有一致性 。 基于深度學習的框架,必須通過當前訓練數(shù)據(jù)擬合到目標函數(shù) 。 在這個框架之下,如果機器要識別狗,它會通過狗的眼睛、鼻子、耳朵等局部特征進行可視化識別,而這些可視化特征卻能給想利用深度學習漏洞的人機會,后者可以通過偽造數(shù)據(jù)來欺騙機器 。
【“暗黑版”AI現(xiàn)身引憂慮 我們需要怎樣的人工智能?】除了人訓練機器的數(shù)據(jù)本身有偏差以外,機器通過對抗性神經網絡合成的數(shù)據(jù)也可能有問題 。 由于機器不可能“見過”所有東西(比如識別桌子,機器不可能學習所有長短寬窄各異的桌子),人也不可能標記所有數(shù)據(jù) 。 如果研究者輸入一個隨機的噪音,機器可以向任何方向學習 。 這是一把雙刃劍,機器也可能合成一些有問題的數(shù)據(jù),學習時間長了,機器就“跑偏”了 。
數(shù)據(jù)的均衡或可減少“跑偏”
不少科學家以“garbage in, garbage out”來形容“數(shù)據(jù)和人工智能的關系” 。 中科視拓(北京)科技有限公司CEO劉昕說:“對機器學習而言,進什么就出什么 。 監(jiān)督學習就是讓模型擬合標簽,比如訓練者把帥哥都標記成‘渣男’,那么機器看到劉德華,就會認為他是……”談到諾曼引發(fā)的討論,劉昕表示:“不需要擔心,人類本身就有各種歧視和偏見,用人類生產的數(shù)據(jù)訓練AI,再批判AI不夠正直良善,這么說有點危言聳聽 。 ”
偏見、刻板印象、歧視都是人類社會的痼疾,有些流于表面,有些深入社會肌理,無法輕易剝離 。 在這樣的語境中產生的數(shù)據(jù),攜帶著大量復雜、難以界定、泥沙俱下的觀點 。 如果研究者沒有意識到或著手處理這一問題,機器學習的偏見幾乎無解 。 真正的“公正算法”或許是不存在的 。

推薦閱讀