日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

AI 聲音鑒定( 二 )


潛在的缺點(diǎn)
在許多方面來(lái)看,AV-HuBERT 象征著 Meta 在用于復(fù)雜任務(wù)的無(wú)監(jiān)督、多模式技術(shù)方面不斷增長(zhǎng)的投資 。
Meta 表示 AV-HuBERT 可以為開(kāi)發(fā)“低資源”語(yǔ)言的對(duì)話(huà)模型開(kāi)辟可能性 。該公司建議,AV-HuBERT 還可用于為有語(yǔ)言障礙的人創(chuàng)建語(yǔ)音識(shí)別系統(tǒng),以及檢測(cè)深度偽造和為虛擬現(xiàn)實(shí)化身生成逼真的嘴唇運(yùn)動(dòng) 。
在各方面數(shù)據(jù)上,新方法的變現(xiàn)著實(shí)很精彩,但也有學(xué)者有一些擔(dān)憂(yōu) 。
其中,華盛頓大學(xué)的人工智能倫理學(xué)專(zhuān)家Os Keye就提到,對(duì)于因患有唐氏綜合征、中風(fēng)等疾病而導(dǎo)致面部癱瘓的人群,依賴(lài)讀唇的語(yǔ)音識(shí)別還有意義嗎?
在微軟和卡內(nèi)基梅隆大學(xué)的一篇論文中,提出了人工智能公平性研究路線(xiàn)圖,指出類(lèi)似于 AV-HuBERT 的面部分析系統(tǒng)的某些方面可能不適用于患有唐氏綜合癥、軟骨發(fā)育不全(損害骨骼生長(zhǎng))和“導(dǎo)致特征性面部差異的其他條件”等 。
Mohamed 強(qiáng)調(diào) AV-HuBERT 只關(guān)注唇部區(qū)域來(lái)捕捉唇部運(yùn)動(dòng),而不是整個(gè)面部 。他補(bǔ)充說(shuō),與大多數(shù) AI 模型類(lèi)似,AV-HuBERT 的性能將“與訓(xùn)練數(shù)據(jù)中不同人群的代表性樣本數(shù)量成正比” 。
“為了評(píng)估我們的方法,我們使用了公開(kāi)可用的 LRS3 數(shù)據(jù)集,該數(shù)據(jù)集由牛津大學(xué)研究人員于 2018 年公開(kāi)提供的 TED Talk 視頻組成 。由于該數(shù)據(jù)集不代表殘疾說(shuō)話(huà)者,因此我們沒(méi)有預(yù)期性能下降的特定百分比,”Mohamed 說(shuō) 。
【AI 聲音鑒定】Meta 表示,它將“繼續(xù)在背景噪聲和說(shuō)話(huà)者重疊很常見(jiàn)的日常場(chǎng)景中進(jìn)行基準(zhǔn)測(cè)試和開(kāi)發(fā)改進(jìn)視聽(tīng)語(yǔ)音識(shí)別模型的方法 ?!?br /> 參考鏈接:
https://venturebeat.com/2022/01/07/meta-claims-its-ai-improves-speech-recognition-quality-by-reading-lips/

推薦閱讀