奇富科技全球頂會INTERSPEECH引熱議,方言識別技術成焦點

【奇富科技全球頂會INTERSPEECH引熱議,方言識別技術成焦點】奇富科技全球頂會INTERSPEECH引熱議,方言識別技術成焦點

文章圖片

奇富科技全球頂會INTERSPEECH引熱議,方言識別技術成焦點
近日 , 奇富科技受邀出席了在希臘舉辦的國際語音通信與信號處理頂級會議——INTERSPEECH 2024 , 并發表了題為Qifusion-Net: Layer-adapted Stream/Non-stream Model for End-to-End Multi-Accent Speech Recognition的主旨演講 , 全面展示了其在語音識別技術領域的成就 , 為中國語音技術走向世界、參與全球競爭樹立了新的標桿 。
INTERSPEECH作為全球語音科學界最負盛名的年度會議之一 , 匯聚了來自世界各地的頂尖學者、研究人員及行業領袖 , 共同探討語音技術的最新進展、挑戰與未來趨勢 。 這一平臺不僅代表了語音技術領域的最高學術水平 , 也是新技術、新理念交流與碰撞的絕佳場所 , 其權威性和影響力在業界無出其右 。
奇富科技在INTERSPEECH 2024會議做主旨演講
在演講中 , 奇富科技介紹了可同時支持20多種方言的新一代奇富語音識別系統“QiFree” , 這是國內金融行業內字錯率最低的中文語音識別系統 。 在中文口音與方言語音識別領域的權威測試集KeSpeech的對比中 , 奇富科技憑借其在自動語音識別(Automatic Speech Recognition ASR)領域的深厚積累 , 實現了方言口音分類準確率的顯著提升 , 達到了79.10% , 遠超KeSpeech的基線水平61.13% , 這一數據直觀反映了奇富科技在語音識別準確性上的卓越表現 。
同時 , 在衡量識別錯誤率的關鍵指標——CER(Character Error Rate 字符錯誤率)上 , 奇富科技更是以8.08%的成績 , 遠優于KeSpeech的10.38% , 展現了其在中文方言識別領域的高效與精準 。
奇富科技“QiFree”性能效果與KeSpeech Baseline對比
奇富科技自研的中文語音識別系統“QiFree” , 打破了單一模型只能識別特定單一方言的困境 , 通過創新的層自適應融合結構 , 借助共享信息編碼模塊更高效的提取方言信息 , 實現了即說即譯 , 進一步增強了語音機器人的實時交互能力 。
值得一提的是 , “QiFree”不僅在普通話識別領域的CER上保持領先地位 , 更在冀-魯、江淮、膠-遼、蘭-銀等多個方言區域的識別性能上 , 相比過往最佳成績實現了超過15%的顯著提升 。 這一突破性成果得到了INTERSPEECH三位獨立審稿人的高度認可 , 他們一致認可奇富科技論文《Qifusion-Net:基于特征融合的流式/非流式端到端多口音語音識別框架》所展現的系統框架創新性與識別性能的卓越表現 , 并一致授予其“ACCEPT”的評定 。
值得一提的是 , 在與國內一流公司(如某科技巨頭及國內影響力最大的語音識別開源社區)的對比中 , 奇富科技同樣展現出了壓倒性的優勢 。 即便是在面對參數規模更大、訓練數據量更豐富的對手時 , 奇富科技依然能以更低的CER(8.08% vs 15.61% vs 26.55%)脫穎而出 , 證明了其技術架構的優越性和算法優化的高效性 。
此外 , 與全球領先的語音識別系統(如Openai-whisper v2)相比 , 盡管后者在通用語言識別上具有顯著優勢 , 但在中文方言識別這一細分領域 , 奇富科技依然保持了顯著優勢 , 這進一步印證了其在方言識別技術上的全球領先地位 。
奇富科技“QiFree”關鍵指標與國內外一流科技公司對比
奇富科技在INTERSPEECH 2024上的再一次精彩亮相 , 不僅是對其多年來在語音識別技術領域深耕細作成果的一次全面展示 , 更是向世界宣告了中國企業在這一領域的強大競爭力和無限潛力 。 奇富科技正以其卓越的技術實力和創新精神 , 引領著方言識別技術的新一輪發展潮流 , 為全球語音通信與信號處理技術的進步貢獻著中國智慧與中國力量 。

    推薦閱讀