日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

AI時(shí)代需要怎樣的輸入法?解構(gòu)訊飛第11代輸入法五大亮點(diǎn)


AI時(shí)代需要怎樣的輸入法?解構(gòu)訊飛第11代輸入法五大亮點(diǎn)


智東西(公眾號(hào):zhidxcom
作者 | 楊暢
編輯 | 漠影
你試過(guò)15分鐘寫(xiě)3000字嗎?
除了知識(shí)儲(chǔ)備和靈感之外,碼字速度同樣是一個(gè)作者重要的必殺技 。作為一位作者,劍飛最常用的碼字神器就是訊飛輸入法的語(yǔ)音輸入功能,他還曾經(jīng)嘗試過(guò)用訊飛輸入法日更15萬(wàn)字 。
輸入法雖然是人們使用手機(jī)、電腦等智能設(shè)備的必備工具,但大家在平常被問(wèn)到最常使用的App是哪個(gè)的時(shí)候,很少有人會(huì)想起它 。
不過(guò)隨著越來(lái)越多AI技術(shù)應(yīng)用到輸入法中,輸入法逐漸從工具性產(chǎn)品發(fā)展成服務(wù)性產(chǎn)品,變得更貼心了,像訊飛輸入法中的中英文混合輸入功能、AI助手提供的AI校對(duì)、AI斗圖等等,為用戶(hù)提供了更個(gè)性化和場(chǎng)景化的服務(wù) 。
今年是訊飛輸入法推出的第11年,每年都會(huì)升級(jí)一個(gè)大版本的訊飛輸入法,在11月3日發(fā)布了今年全新升級(jí)后的輸入法:訊飛輸入法V11.0 。第11代訊飛輸入法有五大亮點(diǎn)變化:AI語(yǔ)音升級(jí)、AI助手升級(jí)、AI鍵盤(pán)輸入升級(jí)、AI表情升級(jí)和輸入法App UI、App內(nèi)社區(qū)改版 。
AI時(shí)代需要怎樣的輸入法?解構(gòu)訊飛第11代輸入法五大亮點(diǎn)


具體新升級(jí)的訊飛輸入法能給用戶(hù)帶來(lái)怎樣不同的輸入體驗(yàn),這些升級(jí)背后訊飛輸入法又融入了哪些獨(dú)有的AI能力?
為此,智東西對(duì)話(huà)科大訊飛輸入法業(yè)務(wù)部總經(jīng)理程坤,在解構(gòu)訊飛輸入法五大新亮點(diǎn)的同時(shí),進(jìn)一步解開(kāi)訊飛在AI賦能輸入法方面的邏輯和思考 。
一、語(yǔ)音輸入進(jìn)化,應(yīng)對(duì)中英文夾雜、嘈雜街頭考驗(yàn)近幾年隨著語(yǔ)音識(shí)別等相關(guān)的技術(shù)的發(fā)展,越來(lái)越多用戶(hù)開(kāi)始使用、習(xí)慣語(yǔ)音輸入的方式 。不過(guò),相對(duì)于拼音輸入和手寫(xiě)輸入來(lái)說(shuō),語(yǔ)音輸入還有比較大的局限性,其中最大的一個(gè)局限性就是容易受到周?chē)h(huán)境的影響,比如說(shuō)高噪聲、多人說(shuō)話(huà)的嘈雜場(chǎng)合等,如何保證一個(gè)比較好的識(shí)別效果是需要重點(diǎn)去突破的技術(shù)難點(diǎn) 。
程坤談到訊飛從啟動(dòng)深度學(xué)習(xí)語(yǔ)音識(shí)別研究以來(lái),一直在優(yōu)化迭代其語(yǔ)音識(shí)別模型框架,從DNN到RNN到DFCNN再到Encode-decode,不斷提升語(yǔ)音識(shí)別的效果,進(jìn)而保證訊飛輸入法語(yǔ)音輸入等訊飛語(yǔ)音相關(guān)產(chǎn)品的功能持續(xù)優(yōu)化 。
受到人耳具備的聽(tīng)覺(jué)選擇性注意能力的啟發(fā),訊飛提出復(fù)雜場(chǎng)景下的前后端一體化語(yǔ)音識(shí)別框架TFMA(Temporal feedback end-end multi-channel ASR)框架,將原有的語(yǔ)音識(shí)別過(guò)程進(jìn)行重構(gòu) 。
AI時(shí)代需要怎樣的輸入法?解構(gòu)訊飛第11代輸入法五大亮點(diǎn)


傳統(tǒng)語(yǔ)音識(shí)別系統(tǒng)
傳統(tǒng)的語(yǔ)音識(shí)別是首先通過(guò)聲學(xué)模型將聲音進(jìn)行過(guò)濾,得到特征信號(hào),通過(guò)第一道識(shí)別引擎把這些特征轉(zhuǎn)化成如發(fā)音信息等音素,然后結(jié)合語(yǔ)言模型將語(yǔ)音轉(zhuǎn)化為文字 。
在這個(gè)語(yǔ)音轉(zhuǎn)文字的過(guò)程中,如果背景聲音是有多個(gè)人在同時(shí)說(shuō)話(huà),使用傳統(tǒng)語(yǔ)音識(shí)別系統(tǒng)是沒(méi)有辦法將這么多聲音過(guò)濾掉的,進(jìn)而影響了輸入法語(yǔ)音識(shí)別的準(zhǔn)確性 。
目前,訊飛做了一些創(chuàng)新,高效利用多通道語(yǔ)音輸入,比如新發(fā)布的這個(gè)TFMA語(yǔ)音識(shí)別框架可以解決復(fù)雜場(chǎng)景下的語(yǔ)音識(shí)別問(wèn)題 。該方案的技術(shù)創(chuàng)新點(diǎn)在于采用前后端聯(lián)合建模、優(yōu)化的方案,形成一套自下而上與自上而下互相結(jié)合的流程,同時(shí)還引入大量的專(zhuān)家知識(shí),結(jié)合神經(jīng)網(wǎng)路網(wǎng)絡(luò)與傳統(tǒng)信號(hào)處理的優(yōu)勢(shì),保證了系統(tǒng)的魯棒性 。
AI時(shí)代需要怎樣的輸入法?解構(gòu)訊飛第11代輸入法五大亮點(diǎn)


TFMA語(yǔ)音識(shí)別框架
通過(guò)運(yùn)用TFMA語(yǔ)音識(shí)別框架,包括訊飛輸入法在內(nèi)訊飛的軟硬件產(chǎn)品大大受益,這些產(chǎn)品在高噪聲、多人說(shuō)話(huà)、輕聲說(shuō)話(huà)等復(fù)雜場(chǎng)景下的語(yǔ)音識(shí)別能力再次提升,特別是-10分貝至-15分貝等惡劣場(chǎng)景下的識(shí)別由不可用變?yōu)榭捎蒙踔梁糜?。

推薦閱讀