alexa語音助手,內置Alexa語音助手

怎么看待如今的語音助手?

alexa語音助手,內置Alexa語音助手


在許多的科幻電影中,機器人被描述的與人類無異:無論是其外觀,還是其說法方式,都看不出與人類的差別,甚至產生一段“人機戀” 。不過就現階段而言,機器人尚未發展到這種程度,特別是若要機器人與人類產生戀情,聲音與交流將是非常關鍵的一環 。為了讓語音助手的發聲更像人類,從而能進一步提升這類產品對消費者的吸引力,眾多巨頭都做了很多努力,希望讓語音助手的發聲更自然,也更口語化,就像你在與真人交流那樣,從而為消費者帶來更真實、更貼近生活的語音助手 。
谷歌用機器學習優化語音助手谷歌近期就發布了全新的AI語音合成器,一個名為“Cloud Text-to-Speech”的服務,能讓語音助手聽起來更自然更口語化,服務于需要語音合成服務的開發者或企業,無論是應用、網頁還是虛擬助理均可使用 。其特別之處在于,“Cloud Text-to-Speech”通過谷歌旗下人工智能子公司DeepMind開發的WaveNet來驅動 。
據了解,DeepMind的AI語音合成技術是目前行業最先進、最可實現的技術之一:大部分語音合成器(包括Siri)都使用了“連接合成”技術——程序會儲存單個音節,然后再將其組合到一起,形成單詞和句子,雖然這種方法近年來不斷進步,但聽起來還是非常呆板生硬 。相比之下,WaveNet使用了機器學習來從頭生成語音 。
實際上,WaveNet分析了一個巨大人類語音數據庫的波形,并以每秒2.4萬個樣本的速度對其重新創建,從而能讓我們感受到一些微妙的變化,包括口音和唇音等 。它之前已經被整合到Google Assistant中(盡管只支持英文和日文),現在則擁有了更多選擇 。谷歌表示,新服務可提供12種語言的32種不同聲音能力,而且用戶可以定制高音和語速等細節 。
微軟蘋果等也要讓語音助手像人類據了解,微軟同樣利用機器學習等技術讓Cortana聲音更接近人類:Cortana會根據用戶當前對話情景進行情感分析,從而控制自己的語音和語調,產生相應語氣 。此外,Cortana更像人也與其聲音來源(Jen Taylor,為《光環》游戲Cortana配音)有關,“就閑聊部分,全部都是Jen Taylor的聲音;其他部分將由其他聲音混合使用” 。
蘋果在iOS 11發布時這樣評價SIri,“它很自然!一點都不像機器人!”這是因為和過去相比,siri說話時會在句子間加入更多的停頓,更多的長音,更輕快的語調變化,因此它將會比過去更流暢,更像“人”;此外在學會一門新語言的過程中,Siri團隊試圖找到每一個音所有的說法,比如連讀、輕讀、重音、長音、升調、降調等等 。
亞馬遜Alexa擁有比較明顯的機器人口音,為此亞馬遜升級過語音合成標記語言標簽,希望能為Alexa帶來低聲說話,停頓,咒罵,以及整語音的速度、音量和聲調等,從而能聽上去不那么像是機器人 。三星在中文版Bixby 2.0發布會上也強調,Bixby “能聽會看懂你心”,是一款真正“會說人話”的語音助手 。語音助手的競爭很激烈在人機交互方面,語音助手正在引領AI為主導的下一代人機交互時代,引發了眾多科技公司的競逐:國內的百度搜狗科大訊飛,以及國外的微軟谷歌蘋果亞馬遜等公司都非常重視語音交互技術,試圖讓語音交互變得更為實用,從而能爭奪新時代下的超級入口 。
據媒體報道,Spotify也正測試其語音助手,將讓消費領域的語音助手之爭變得更加激烈 ??萍脊疽裁闇柿苏Z音助手在企業領域的前景 。前段時間,IBM正式發布了沃森助手(Watson Assistant),可以置于多種平臺,如汽車、酒店或家電等 。據IBM稱,Watson是一個企業助理,旨在幫助企業提高他們的消費者體驗 。

推薦閱讀