自動語音識別( ASR ) – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Thu, 29 Jun 2023 06:31:53 +0000 zh-CN hourly 1 196178272 語音 AI 聚焦:在 AR 眼鏡上可視化口語和聲音 http://www.open-lab.net/zh-cn/blog/speech-ai-spotlight-visualizing-spoken-language-and-sounds-on-ar-glasses/ Fri, 23 Jun 2023 06:28:36 +0000 http://www.open-lab.net/zh-cn/blog/?p=7276 Continued]]> 音頻可以包括各種各樣的聲音,從人類的語音到狗叫聲和警笛聲等非語音。當為聽力困難的人設計可訪問的應用程序時,該應用程序應該能夠識別聲音和理解語音。 這項技術將幫助聾人或重聽人可視化語音,如人類對話和非語音。將語音和聲音 AI 結合在一起,你可以將可視化效果疊加到 AR 眼鏡上,讓用戶可以看到和解釋他們在其他情況下聽不到的聲音。 根據世界衛生組織估計,全球約有 15 億人(占全球人口的近 20%)患有聽力損失。到 2050 年,這一數字可能會上升至 25 億。 Cochl,一家總部位于圣何塞的 NVIDIA 合作伙伴,是一家深度科技初創公司,使用聲音 AI 技術來理解任何類型的音頻。他們也是 NVIDIA 的Inception Program的成員,通過提供尖端技術和 NVIDIA 專家,幫助初創公司更快地構建解決方案。 該平臺可以識別 37 種環境聲音,該公司更進一步,

Source

]]>
7276
為全球語言用戶解鎖語音 AI 技術:熱門問答 http://www.open-lab.net/zh-cn/blog/unlocking-speech-ai-technology-for-global-language-users-top-qas/ Tue, 06 Jun 2023 06:50:12 +0000 http://www.open-lab.net/zh-cn/blog/?p=7157 Continued]]> 語音技術正在無處不在地發展。但許多人正被一個以英語為中心、存在人口統計學偏見的算法世界拋在后面。Mozilla Common Voice(MCV)和NVIDIA正在合作,通過開發一個公共眾包多語言語音語料庫和開源預訓練模型來改變這一現狀,該語料庫目前是世界上同類語料庫中最大的。現在比以往任何時候都更容易開發自動語音識別(ASR)技術,以滿足多種語言的使用者。 這篇文章總結了來自于2022年由EM Lewis Jong主演的 Speech AI Summit 和 Mozilla Common Voice 以及NVIDIA 的 Caroline de Brito Gottlieb 在 Unlocking Speech AI Technology for Global Language Users 中提出的錄音講話。 Caroline de Brito Gottlieb:

Source

]]>
7157
使用 NVIDIA 定制語音 AI 增強電信客戶體驗 http://www.open-lab.net/zh-cn/blog/enhancing-customer-experience-in-telecom-with-nvidia-customized-speech-ai/ Tue, 30 May 2023 05:28:40 +0000 http://www.open-lab.net/zh-cn/blog/?p=7096 Continued]]> 電信行業正在改變通信方式。為了提供可靠、不間斷的服務,企業正在應對提供最佳客戶體驗的挑戰。 這種最佳的客戶體驗是大型電信服務提供商的許多長期客戶所沒有的。以杰克為例。他的電話被掛了 10 分鐘,這使他上班遲到了。與他交談過的第三位代理人吉爾閱讀了前一位代理人提供的簡短說明,但很難理解。因此,她問了杰克幾個問題來澄清。由于沒有同事, Jill 查閱了多份政策文件來解決 Jack 的擔憂。幾個資源之后,吉爾找到了必要的信息,但遺憾的是,杰克已經結束了通話。 漫長的等待時間、復雜的服務請求和缺乏個性化是客戶面臨的一些常見問題,導致了不滿和流失。為了克服這些挑戰,電信行業正在轉向人工智能對話式 AI,一種利用語音、翻譯和自然語言處理( NLP )來促進類人交互的技術。 這篇文章探討了為什么對話式人工智能系統是必不可少的,

Source

]]>
7096
數據中立化如何轉變客戶服務聯絡中心 http://www.open-lab.net/zh-cn/blog/how-language-neutralization-is-transforming-customer-service-contact-centers/ Tue, 30 May 2023 05:21:28 +0000 http://www.open-lab.net/zh-cn/blog/?p=7090 Continued]]> 根據 Gartner® 的數據,“近一半的數字工作者很難找到他們工作所需的數據,近三分之一的人由于缺乏信息意識而做出了錯誤的商業決定。”1為了應對這一挑戰,越來越多的企業正在客戶服務中部署人工智能,因為它有助于提供更高效、更信息化的個性化服務。 諸如 語音轉文字,文本到語音,翻譯,深度學習, transformer 模型,以及生成式人工智能改變了企業與客戶互動的方式。這些技術實現了: 人工智能算法可以處理和分析大量數據,識別客戶需求和行為模式,并幫助創造吸引人和令人滿意的客戶體驗。總體而言,人工智能在客戶服務中的使用顯著提高了客戶互動的質量和效率,使企業和客戶都受益。 在全球經濟中,企業在不同國家開展業務,為具有不同語言和文化背景的客戶提供服務。這種全球語言多樣性給聯絡中心帶來了獨特的挑戰。 有效的溝通對于提供卓越的客戶服務至關重要,而語言障礙可能會導致溝通失誤、

Source

]]>
7090
語音識別如何改善電信客戶服務 http://www.open-lab.net/zh-cn/blog/how-speech-recognition-improves-customer-service-in-telecommunications/ Tue, 02 May 2023 02:09:53 +0000 http://www.open-lab.net/zh-cn/blog/?p=6840 Continued]]> 通信行業近年來人工智能技術激增,語音識別和翻譯首當其沖。多語人工智能虛擬助手,數字人,聊天機器人,代理協助,以及音頻轉錄是正在徹底改變電信行業的技術。企業正在呼叫中心實施人工智能,以加快處理傳入請求,從而大幅改善客戶體驗、員工忠誠度和品牌聲譽。 例如,自動語音識別( ASR ),也稱為語音轉文本,已被用于實時轉錄對話,使企業能夠快速為客戶確定資源或解決方案。Speech AI還被用于分析情緒,確定摩擦源,并提高合規性和代理性能。 這篇文章深入探討了語音識別在電信行業的變革力量,并強調了 AT & T 和T-Mobile正在使用這些最先進的技術在其呼叫中心提供無與倫比的客戶體驗。 語音轉文本技術的實現已經成為客戶服務領域的游戲規則改變者。通過自動化呼叫路由、呼叫分類和語音身份驗證等任務,企業可以大大減少等待時間,并確保客戶能夠找到最合格的代理來處理他們的請求。

Source

]]>
6840
人人超碰97caoporen国产