日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

能把英語音頻翻譯出來的軟件 英語語音翻譯器( 三 )


文本數(shù)據(jù)非常重要,但不足以構(gòu)建滿足所有人需求的翻譯工具 。語音翻譯基準(zhǔn)數(shù)據(jù)以前可用于少數(shù)幾種語言,所以團(tuán)隊(duì)創(chuàng)建了:
CoVoST 2:涵蓋22種語言和36個(gè)不同資源條件的語言方向VoxPopuli:包含23種語言的40萬小時(shí)語音,可用于語音識(shí)別和語音翻譯等語音應(yīng)用的大規(guī)模半監(jiān)督和自監(jiān)督學(xué)習(xí) 。
3. 構(gòu)建跨多種語言和不同模式的模型
除了為機(jī)器翻譯系統(tǒng)的訓(xùn)練提供更多數(shù)據(jù),并將其提供給其他研究人員之外,Meta同時(shí)在努力提高模型的能力,從而能夠處理更廣泛語言之間的翻譯 。如今,機(jī)器翻譯系統(tǒng)通常在單一模態(tài)中工作 。如果模型太小,無法代表多種語言,其性能可能會(huì)受到影響,從而導(dǎo)致文本和語音翻譯的不準(zhǔn)確 。建模方面的創(chuàng)新將幫助我們創(chuàng)造這樣一個(gè)未來:翻譯將能快速、無縫地支持多種語言的不同模式,例如語音到文本,文本到語音,文本到文本或語音到語音 。
為了提高機(jī)器翻譯模型的性能,Meta投入巨資創(chuàng)建了能夠在大容量情況下高效訓(xùn)練的模型 。為了將基于文本的機(jī)器翻譯擴(kuò)展到101種語言,團(tuán)隊(duì)創(chuàng)建了第一個(gè)非以英語為中心的多語言文本翻譯系統(tǒng) 。
雙語系統(tǒng)通常是先從源語言翻譯成英語,然后再?gòu)挠⒄Z翻譯成目標(biāo)語言 。為了令系統(tǒng)更高效、更高質(zhì)量,團(tuán)隊(duì)取消了英語作為媒介,這樣語言就可以直接翻譯成其他語言,無需通過英語 。當(dāng)然,盡管消除英語提高了模型的容量,但多語言模型無法達(dá)到定制雙語系統(tǒng)的質(zhì)量水平 。然而,隨著性能的提升,Meta的多語言翻譯系統(tǒng)贏得了Workshop on Machine Translation competition,甚至超過最好的雙語模特 。
Meta的目標(biāo)是提高技術(shù)的包容性:它應(yīng)該支持書面語言和沒有標(biāo)準(zhǔn)書寫系統(tǒng)的語言 ??紤]到這一點(diǎn),團(tuán)隊(duì)正在開發(fā)一個(gè)語音到語音,不依賴于在推理過程中生成中間文本表示的翻譯系統(tǒng) 。這種方法已證明比傳統(tǒng)的級(jí)聯(lián)系統(tǒng)更快 。憑借更高的效率和更簡(jiǎn)單的架構(gòu),直接語音翻譯可以為未來的設(shè)備開啟實(shí)時(shí)翻譯 。最后,為了創(chuàng)建能夠保留每個(gè)人講話中的表達(dá)能力和特點(diǎn)的口語翻譯,團(tuán)隊(duì)正在努力在生成的音頻翻譯中包括輸入音頻的特定方面,例如語調(diào) 。
4. 衡量數(shù)百種語言的成功
開發(fā)能夠在多種語言之間轉(zhuǎn)換的模型帶來了一個(gè)重要的問題:如何確定是否開發(fā)出了一個(gè)更好的模型呢?評(píng)估一個(gè)大規(guī)模、多語言模型的性能是一件棘手的事情,尤其是因?yàn)樗笪覀兙邆淠P退w的所有語言的專業(yè)知識(shí) 。這是一項(xiàng)耗時(shí)、資源密集且往往不切實(shí)際的挑戰(zhàn) 。
針對(duì)這一點(diǎn),Meta開發(fā)了第一個(gè)涵蓋101種語言的多語言翻譯評(píng)估數(shù)據(jù)集 FLORES-101,以便研究人員能夠快速測(cè)試和改進(jìn)多語言翻譯模型 。與現(xiàn)有的數(shù)據(jù)集不同,F(xiàn)LORES-101允許研究人員通過任何語言方向量化系統(tǒng)的性能,不僅僅只是翻譯成英語和從英語翻譯成其他語言 。對(duì)于操著幾十種官方語言的全球范圍而言,這將能夠創(chuàng)建滿足重要現(xiàn)實(shí)世界需求的翻譯系統(tǒng) 。
利用FLORES-101,Meta正在與人工智能研究業(yè)界合作,并期待著繼續(xù)將FLORES擴(kuò)展到數(shù)百種語言 。
Meta進(jìn)一步指出,未來將致力于負(fù)責(zé)任地開展這項(xiàng)工作 。團(tuán)隊(duì)正在與語言學(xué)家合作,以理解創(chuàng)造準(zhǔn)確數(shù)據(jù)集所面臨的挑戰(zhàn) 。團(tuán)隊(duì)同時(shí)與評(píng)估人員網(wǎng)絡(luò)合作,以確保翻譯的準(zhǔn)確性 。這家公司表示,實(shí)現(xiàn)長(zhǎng)期的翻譯目標(biāo)不僅需要人工智能方面的專業(yè)知識(shí),同時(shí)需要來自世界各地的眾多專家、研究人員和個(gè)人的持續(xù)投入 。
5. 未來
如果No Language Left Behind(不落下任何語言)和Universal Speech Translator能夠成功,再加上機(jī)器翻譯研究業(yè)界的努力,這將能以前所未有的方式融合數(shù)字世界和物理世界 。

推薦閱讀