人工智能投入產業(yè)化發(fā)展,智能語音全速向前

據統(tǒng)計,2022年全國約需200萬人工智能訓練師。這意味著當前社會,隨著數字化、智能化進程不斷加速,人工智能開始進入產業(yè)級大模型時代,無論從政府、企業(yè)還是到個人,

數字化、網絡化、智能化正給其帶來積極迅捷的變化,人工智能在我國發(fā)展十分可期。

智能語音作為人工智能軟件產業(yè)的重要組成部分,已步入快速發(fā)展的新階段。國家工業(yè)信息安全發(fā)展研究中心發(fā)布的《中國智能語音產業(yè)發(fā)展白皮書》顯示,在后疫情時代及產業(yè)數字化需求拉動的大背景下,智醫(yī)助理、電話隨訪、虛擬主播等智能語音應用開啟了新消費市場。預計到2025年,我國智能語音帶動的整體市場規(guī)模,有望在2025年達到875億元,產業(yè)前景十分廣闊。

以世界矚目的北京冬奧會為例,每當走進北京冬奧小屋,就能聽到一位名為“小晴”的主播,將普通話實時翻譯成英語、法語、日語等全世界多個語種,對冬奧會新聞依次播報,讓奧運聲音更快傳遍全球。她其實就是一個在智能語音識別技術加持下誕生的虛擬主播,能通過數字化技術走進并服務人們的生活。而不同智能語音的多場景生活應用,也帶動了一批像移動云一樣的數字化產品企業(yè),不斷優(yōu)化升級相關技術,研發(fā)出科技性與實用性兼具的智能語音云產品。

移動云智能語音交互,就是利用人工智能技術衍生出的可服務不同領域的智能語音產品。移動云智能語音交互,包含3款語音類產品,分別為語音識別、語音合成、語音擴展。語音識別就是將語音信息轉換成對應的文字信息,讓機器能夠“聽懂”人類語言,解放用戶雙手,提高效率;包括語音聽寫、語音轉寫、實時語音轉寫和離線語音聽寫4款服務。而語音合成是將文字信息合成為語音信息,實現讓應用或設備開口說話,使其根據個性,提升交互體驗,音色、自然度等方面的表現均接近甚至超過了人聲;包括在線語音合成和離線語音合成兩款產品。語音擴展則包括聲紋識別、語義理解、機器翻譯、語音喚醒、離線命令詞識別在內的5種智能語音能力,可以應用于絕大多數智能語音交互設備上。

不難看出,在人工智能技術的加持下,未來智能語音相關技術和產品的發(fā)展態(tài)勢將十分迅猛。據普華有策分析,未來的智能語音,將會優(yōu)化人機交互體驗、全雙工語音將會出現,人機交互將會朝著更自然、更順暢的方向發(fā)展,以對話交互為核心的認知和知識計算也將成為智能信息服務的重要技術趨勢。

免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。

關鍵詞:
圖片版權歸原作者所有,如有侵權請聯系我們,我們立刻刪除。
新化月報網報料熱線:886 2395@qq.com

相關文章

你可能會喜歡

最近更新

推薦閱讀