Sven Chilton – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Fri, 21 Feb 2025 04:08:54 +0000 zh-CN hourly 1 196178272 使用 Whisper 和 Canary 架構部署 NVIDIA Riva 多語種 ASR,同時選擇性地停用 NMT http://www.open-lab.net/zh-cn/blog/deploying-nvidia-riva-multilingual-asr-with-whisper-and-canary-architectures-while-selectively-deactivating-nmt/ Thu, 20 Feb 2025 04:05:01 +0000 http://www.open-lab.net/zh-cn/blog/?p=12956 Continued]]> NVIDIA 持續開發自動語音識別 (ASR) 模型,這些模型在業內樹立了基準。 早期版本的 NVIDIA Riva 是一種適用于 ASR 、 TTS 和 NMT 的 GPU 加速語音和翻譯 AI 微服務的集合,支持基于 Conformer 架構的英語-西班牙語和英語-日語代碼交換 ASR 模型,以及基于 Parakeet 架構的支持 EMEA 地區多種語言(即英國英語、歐洲西班牙語、法語、意大利語、標準德語和亞美尼亞語)的模型。 最近,NVIDIA 發布了 Riva 2.18.0 容器和 SDK ,以不斷改進其語音 AI 模型。在此新版本中,我們現在提供以下服務: 自動語音翻譯 (AST)是將一種語言的語音翻譯為另一種語言的文本,而無需以第一種語言進行中間轉錄。

Source

]]>
12956
使用 NVIDIA NIM 微服務實現語音和翻譯功能,快速賦予應用語音能力 http://www.open-lab.net/zh-cn/blog/quickly-voice-your-apps-with-nvidia-nim-microservices-for-speech-and-translation/ Wed, 18 Sep 2024 07:42:34 +0000 http://www.open-lab.net/zh-cn/blog/?p=11374 Continued]]> NVIDIA NIM 是 NVIDIA AI Enterprise 的一部分,為自行托管的 GPU 加速推理微服務提供容器,用于跨云、數據中心和工作站的預訓練和自定義 AI 模型。NIM 微服務現已支持 語音和翻譯 。 新的語音和翻譯微服務利用 NVIDIA Riva ,提供 自動語音識別(ASR)、 神經網絡機器翻譯(NMT) 和 文本轉語音(TTS) 服務。 通過 NVIDIA 語音和翻譯 NIM 微服務,將多語種語音功能集成到您的應用中,不僅能提供先進的自動語音識別(ASR)、神經機器翻譯(NMT)和文本轉語音(TTS),還可增強全球用戶體驗和可訪問性。無論您是構建客戶服務機器人、交互式語音助手,還是構建多語種內容平臺,這些 NIM 微服務都針對大規模高性能 AI 推理進行了優化,并提供準確性和靈活性,以盡可能減少開發工作量為您的應用提供語音支持。

Source

]]>
11374
如何在公有云中部署 NVIDIA Riva 語音和翻譯 AI http://www.open-lab.net/zh-cn/blog/how-to-deploy-riva-speech-and-translation-ai-in-the-public-cloud/ Tue, 29 Aug 2023 05:09:02 +0000 http://www.open-lab.net/zh-cn/blog/?p=7711 Continued]]> 從初創企業到大型企業,企業都使用云市場來尋找快速轉型所需的新解決方案。云市場是在線店面,客戶可以在這里購買具有靈活計費模式的軟件和服務,包括現收現付、訂閱和私人協商優惠。企業進一步受益于以折扣價承諾的支出,以及節省時間和資源的單一賬單和發票來源。 NVIDIA Riva 是最先進的語音和翻譯人工智能服務,在最大的云服務提供商(CSP)市場上: 公司可以快速找到高性能的語音和翻譯人工智能,這些人工智能可以完全定制,以最適合對話管道,如問答服務、智能虛擬助理、數字化身和不同語言的聯絡中心代理助理。 組織可以在公共云上快速運行 Riva ,或將其與云提供商服務集成,從而獲得更大的信心和更好的投資回報。有了云計算中的 NVIDIA Riva ,您現在可以通過瀏覽器即時訪問 Riva 語音和翻譯 AI——即使您目前沒有自己的內部部署 GPU ——加速的基礎設施。

Source

]]>
7711
縮短聯絡中心智能虛擬助理的開發時間 http://www.open-lab.net/zh-cn/blog/reducing-development-time-for-intelligent-virtual-assistants-in-contact-centers/ Thu, 15 Dec 2022 07:12:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=5901 Continued]]> 隨著全球服務經濟的發展,公司越來越依賴于聯系中心來改善客戶體驗,提高客戶滿意度,降低成本并提高效率。客戶需求的增長速度遠遠超過了聯絡中心的就業率。與高代理流失率相結合,客戶需求產生了對更自動化的實時客戶通信的需求,從而增強了代理的能力。 研究人員早在 20 世紀 70 年代就認識到了這些趨勢,并開始開發可通過觸音電話導航的原始語音菜單。雖然語音菜單可能會回答常見問題,并減輕聯絡中心代理的壓力,但客戶通常會發現與他們互動令人沮喪。 由于以下任何原因,您可能是想要直接與代理通話的來電者之一,而不是收聽多層預先錄制的語音提示: 為了有效解決這些問題,公司已開始將智能虛擬助理(也稱為 AI 虛擬助理)集成到其聯絡中心解決方案中。 在本篇文章中,我們概述了如何使用 NVIDIA 聯絡中心智能虛擬助理工作流和組件(如 NVIDIA Riva 語音技術和 speech AI…

Source

]]>
5901
語音 AI 機器人的低代碼構建塊 http://www.open-lab.net/zh-cn/blog/low-code-building-blocks-for-speech-ai-robotics/ Thu, 22 Sep 2022 08:00:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=5181 Continued]]> 在研究復雜的語音人工智能機器人系統時,開發人員很容易被其復雜性嚇倒。亞瑟· C ·克拉克聲稱:“任何足夠先進的技術都無法與魔法區分開來。” 從接受自然語言命令到安全地與環境和周圍的人實時交互,當今的語音人工智能機器人系統可以執行以前機器無法完成的任務。加入谷歌、 Meta 、 NVIDIA 等公司的專家,參加第一屆年度 NVIDIA -Speech AI 峰會。 立即注冊 以 Spot 為例,它是一個支持語音 AI 的機器人,可以自己取飲料。為了方便地添加語音 AI 技能,例如 自動語音識別 ( ASR )或文本到語音( TTS ),許多開發人員在構建復雜的機器人系統時使用更簡單的低代碼構建塊。 對于開發具有語音 AI 技能的機器人應用程序的開發人員,本文將分解 NVIDIA Riva SDK 提供的低代碼構建塊。 通過跟隨所提供的代碼示例,

Source

]]>
5181
人人超碰97caoporen国产