日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

能把英語音頻翻譯出來的軟件 英語語音翻譯器( 二 )


對于直接的語音到語音翻譯,獲取數(shù)據(jù)的挑戰(zhàn)更為嚴(yán)峻 。大多數(shù)語音機器翻譯系統(tǒng)使用文本作為中間步驟,這意味著語音首先轉(zhuǎn)換為文本,然后翻譯為目標(biāo)語言中的文本,最后再將其輸入到文本到語音系統(tǒng)以生成音頻 。所以語音對語音的翻譯依賴于文本,從而限制了其效率,使其難以擴展到主要是口語的語言 。
直接語音到語音翻譯模型可以為沒有標(biāo)準(zhǔn)化寫作系統(tǒng)的語言進(jìn)行翻譯 。這種基于語音的方法可以帶來更快速、更高效的翻譯系統(tǒng),因為它們不需要額外的步驟 。
除了需要數(shù)千種語言的合適訓(xùn)練數(shù)據(jù)外,今天的機器翻譯系統(tǒng)設(shè)計根本不能滿足全球所有人的需求 。大多數(shù)機器翻譯系統(tǒng)都是雙語,這意味著每個語言對都是一個單獨的模式,例如日英語-俄語或日語-西班牙語 。這種方法很難擴展到幾十個語言對,更不用說全世界范圍內(nèi)的所有語言 。想象一下,從泰語言,老撾語,再到尼泊爾語,每種組合都需要創(chuàng)建和維護數(shù)千種不同的模型 。
一系列的專家建議多語言系統(tǒng)會有所幫助 。但要將多種語言整合到一個高效、高性能、能夠代表所有語言的多語言模型中非常困難 。
實時語音對語音機器翻譯模型面臨一系列與基于文本的模型相同的挑戰(zhàn),并且需要克服延遲問題,然后才能有效地用于實現(xiàn)實時翻譯 。
主要的挑戰(zhàn)基于這樣一個事實:一個句子可以在不同的語言中以不同的語序表達(dá) 。即便是專業(yè)的同聲傳譯員都會落后于原始演講約三秒中 。例如,德語“Ich m?chte alle Sprachen übersetzen”和對等的西班牙語“Quisiera traducir todos los idiomas” 。兩者的英文都是“I would like to translate all languages(我想翻譯所有的語言) 。”相較于西班牙語和英語(詞序相似),從德語到英語的實時翻譯將更具挑戰(zhàn)性,因為對應(yīng)于英語動詞“translate(翻譯)”的德語動詞“übersetzen(翻譯)”出現(xiàn)在句子的末尾 。
最后,隨著擴展到越來越多的語言,我們需要開發(fā)新的方法來評估機器翻譯模型產(chǎn)生的結(jié)果 。業(yè)界已經(jīng)有資源來評估從英語到俄語的翻譯質(zhì)量,但從阿姆哈拉語到哈薩克語呢?
隨著我們擴大機器翻譯模型可以翻譯的語言數(shù)量,我們同時必須開發(fā)新的方法來訓(xùn)練數(shù)據(jù)和測量結(jié)果 。除了評估機器翻譯系統(tǒng)的準(zhǔn)確性外,確保負(fù)責(zé)人地翻譯負(fù)責(zé)任同樣重要 。我們需要確保機器翻譯系統(tǒng)保持文化敏感性,不制造或加劇偏見 。
2. 訓(xùn)練低資源和直接語音翻譯系統(tǒng)
為了實現(xiàn)低資源語言的翻譯,并為未來更多語言的翻譯創(chuàng)建構(gòu)建模塊,Meta正在擴展自動數(shù)據(jù)集創(chuàng)建技術(shù) 。其中一種技術(shù)是開源工具包LASER,它現(xiàn)在包含了用28種不同腳本編寫的125多種語言 。
LASER可以將各種語言的句子轉(zhuǎn)換成單一的多語言表達(dá) 。然后,團隊使用大規(guī)模多語言相似性搜索來識別具有相似表示的句子,即在不同語言中可能具有相同含義的句子 。Meta已經(jīng)利用LASET開發(fā)了在互聯(lián)網(wǎng)中尋找平行文本的ccMatrix和ccAligned 。由于低資源語言幾乎沒有可用的數(shù)據(jù),團隊創(chuàng)建了一種新的teacher-student訓(xùn)練方法,以便LASER能夠?qū)W⒂谔囟ǖ恼Z言亞組,并用更小的數(shù)據(jù)集進(jìn)行學(xué)習(xí) 。這使得LASER能夠跨語言大規(guī)模有效運行 。隨著團隊不斷改進(jìn)和擴展語言,并最終支持每種具有書寫系統(tǒng)的語言,任何進(jìn)步都將能幫助我們覆蓋更多的語言 。
Meta最近已經(jīng)將LASER擴展成支持語音 。:通過在同一個多語言空間中構(gòu)建語音和文本的表示,其能夠在一種語言的語音和另一種語言的文本之間提取翻譯,甚至可以直接進(jìn)行語音到語音的翻譯 。通過這種方法,團隊已經(jīng)識別了近1400小時的法語、德語、西班牙語和英語對齊語音 。

推薦閱讀