Speech Recognition – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Thu, 07 Jul 2022 09:06:24 +0000
zh-CN
hourly
1
196178272 -
為 NVIDIA MLPerf Training v2.0 性能提供動力的全堆棧優化
http://www.open-lab.net/zh-cn/blog/boosting-mlperf-training-performance-with-full-stack-optimization/
Thu, 30 Jun 2022 02:02:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=4498
Continued]]>
MLPerf benchmarks 由工業界、學術界和研究實驗室的人工智能領導者組成的聯盟開發,旨在提供標準、公平和有用的深度學習性能測量。 MLPerf 訓練側重于測量時間,以便為以下任務訓練一系列常用的神經網絡: 減少培訓時間對于加快部署時間、最小化總體擁有成本和最大化投資回報至關重要。 然而,與平臺性能一樣重要的是它的多功能性。訓練每個模型的能力,以及提供基礎設施可替代性以運行從訓練到推理的所有人工智能工作負載的能力,對于使組織能夠最大限度地實現其基礎設施投資的回報至關重要。 NVIDIA platform 具有全堆棧創新和豐富的開發人員和應用程序生態系統,仍然是唯一提交所有八個 MLPerf 訓練測試結果,以及提交所有 MLPerf 推理和 MLPerf 高性能計算( HPC )測試結果的系統。 在本文中,您將了解 NVIDIA 在整個堆棧中部署的方法,
Source
]]>
4498
-
語音 AI 簡介
http://www.open-lab.net/zh-cn/blog/an-easy-introduction-to-speech-ai/
Thu, 23 Jun 2022 07:27:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=4422
Continued]]>
人工智能( AI )已經將合成語音從單調的機器人呼叫和幾十年前的 GPS 導航系統轉變為智能手機和智能揚聲器中虛擬助理的優美音調。 對于組織來說,為其特定行業和領域使用定制的最新語音 AI 技術從未如此容易。 語音 AI 正被用于 power 虛擬助理 ,擴展呼叫中心, 使數字化身人性化 , 增強 AR 體驗 ,并通過自動化臨床記錄為患者提供無摩擦的醫療體驗。 根據 Gartner Research ,到 2023 年,客戶將傾向于使用語音接口啟動 70% 的自助式客戶互動 ( 2019 年為 40% )。對個性化和自動化體驗的需求只會繼續增長。 在這篇文章中,我將討論語音 AI ,它是如何工作的,語音識別技術的好處,以及語音 AI 用例的示例。 語音 AI 將 AI 用于基于語音的技術:自動語音識別( ASR ),也稱為語音對文本和文本對語音( TTS )。
Source
]]>
4422
-
用 Riva 和 NeMo Megatron 的最新版本構建多種語言的語音 AI ,并訓練大型語言模型
http://www.open-lab.net/zh-cn/blog/build-speech-ai-in-multiple-languages-and-train-large-language-models-with-the-latest-from-riva-and-nemo-megatron/
Mon, 28 Mar 2022 02:43:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=3490
Continued]]>
上周, NVIDIA GTC 2022 宣布了對 Riva 的重大更新。 Riva 是一個用于構建語音 AI 應用程序的 SDK ,以及一個付費的 Riva 企業產品。 NeMo Megatron 是一個用于訓練大型語言模型的框架,它的幾項關鍵更新也已宣布。 Riva 為跨多種語言的實時自動語音識別( ASR )和文本到語音( TTS )技能提供了世界級的準確性,并且可以部署在 prem 上、任何云中。 Snap 、 T-Mobile 、 RingCentral 和 Kore 等行業領導者。 ai 在客戶服務中心應用程序、轉錄和虛擬助理中使用 Riva 。 最新的 Riva 版本包括: 在手機上嘗試 Riva 自動語音識別 Riva 產品頁面 . Defined.ai 與 NVIDIA 合作,為希望購買跨語言、
Source
]]>
3490
-
使用多種語言創建語音 AI 應用程序,并使用 Riva 自定義文本到語音
http://www.open-lab.net/zh-cn/blog/create-speech-ai-applications-in-multiple-languages-and-customize-text-to-speech-with-riva/
Mon, 07 Feb 2022 07:05:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=3005
Continued]]>
本月, NVIDIA 在 Riva 中發布了西班牙語、德語和俄語的世界級語音到文本模型,為企業在全球部署語音 AI 應用提供了動力。此外,企業現在可以使用 Riva 的可定制文本到語音管道創建富有表現力的語音界面。 NVIDIA Riva 是一款 GPU 加速語音 AI SDK ,用于開發實時應用程序,如實時字幕、向基于文本的聊天機器人添加語音,以及在呼叫中心生成實時轉錄。為了便于實施, Riva 在 NGC 目錄中提供了高度精確的預訓練模型。 和 TAO 工具包 ,這些模型可以為任何行業定制,包括電信、金融、統一通信即服務和醫療保健。開發者可以使用 Riva 開箱即用地部署這些模型。它們經過優化,可以在云、數據中心和邊緣在不到 300 毫秒的時間內實時運行。 從呼叫中心到虛擬助手,每一個對話人工智能應用程序都嚴重依賴于自動語音識別。企業可以通過 Riva 英語、
Source
]]>
3005
-
語音識別:使用 NVIDIA Riva 生成準確的轉錄
http://www.open-lab.net/zh-cn/blog/speech-recognition-generating-accurate-transcriptions-using-riva/
Wed, 10 Nov 2021 07:11:46 +0000
http://www.open-lab.net/zh-cn/blog/?p=2141
Continued]]>
這篇文章是關于生成準確語音轉錄的系列文章的一部分。有關第 2 部分,請參見Speech Recognition: Customizing Models to Your Domain Using Transfer Learning. 有關第 3 部分,請參見Speech Recognition: Deploying Models to Production. 每天,電信、金融和統一通信即服務( UCaaS )等行業都會產生數百萬分鐘的音頻。這些音頻會議記錄可以轉錄,以便為呼叫中心代理提供實時建議,從客戶呼叫記錄中提取見解,或在視頻會議中生成實時字幕。 自動語音識別使您能夠將語音轉錄成文本。生成高質量的文字記錄是一項挑戰,因為這些技能需要理解特定于行業的術語、數百到數千分鐘特定于領域的培訓音頻以及實時運行的管道。 NVIDIA Riva 語音識別是一項技術,
Source
]]>
2141
-
語音識別:使用遷移學習為您的領域定制模型
http://www.open-lab.net/zh-cn/blog/speech-recognition-customizing-models-to-your-domain-using-transfer-learning/
Tue, 09 Nov 2021 10:37:40 +0000
http://www.open-lab.net/zh-cn/blog/?p=2131
Continued]]>
這篇文章是關于生成準確語音轉錄的系列文章的一部分。有關第 1 部分,請參見 Speech Recognition: Generating Accurate Transcriptions Using NVIDIA Riva. 有關第 3 部分,請參見 Speech Recognition: Deploying Models to Production. 從頭開始創建一個新的人工智能深度學習模型是一個非常耗費時間和資源的過程。解決這個問題的一個常見方法是采用遷移學習。為了使這一過程更加簡單,NVIDIA TAO Toolkit,它可以將工程時間框架從 80 周縮短到 8 周。 TAO 工具包支持計算機視覺和對話 AI ( ASR 和 NLP )用例。 在本文中,我們將介紹以下主題: 跟隨 download the Jupyter notebook。
Source
]]>
2131
-
語音識別:將模型部署到生產中
http://www.open-lab.net/zh-cn/blog/speech-recognition-deploying-models-to-production/
Tue, 09 Nov 2021 10:33:28 +0000
http://www.open-lab.net/zh-cn/blog/?p=2128
Continued]]>
這篇文章是關于生成準確語音轉錄的系列文章的一部分。有關第 1 部分,請參見Speech Recognition: Generating Accurate Transcriptions Using NVIDIA Riva.有關第 2 部分,請參見Speech Recognition: Customizing Models to Your Domain Using Transfer Learning NVIDIA Riva 是一款 AI 語音 SDK ,用于開發實時應用程序,如轉錄、虛擬助理和聊天機器人。它包括 NGC 中經過預訓練的最先進模型、用于在您的領域中微調模型的 TAO 工具包以及用于高性能推理的優化技能。 Riva 使使用 NGC 中的 Riva 容器或使用 Helm chart 在 Kubernetes 上部署模型變得更簡單。 Riva 技能由 NVIDIA TensorRT…
Source
]]>
2128
-
使用 NVIDIA Riva 構建轉錄和實體識別應用程序
http://www.open-lab.net/zh-cn/blog/building-transcription-and-entity-recognition-apps-using-riva/
Tue, 09 Nov 2021 09:43:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2250
Continued]]>
在過去的幾個月里,我們中的許多人已經習慣于通過視頻電話看醫生。這當然很方便,但在通話結束后,醫生的重要建議就開始溜走了。我需要服用什么新藥?有什么副作用需要注意嗎? Conversational AI 可以幫助構建一個應用程序來轉錄語音,并突出該轉錄本中的重要短語。 NVIDIA Riva 是一款 SDK ,它可以減少您構建和部署可用于這些任務的最先進的深度學習模型的時間。 在本文中,我們將向您展示如何構建一個 web 應用程序,該應用程序可以從實時視頻聊天中轉錄語音,并在轉錄本中標記關鍵短語。視頻聊天使用 PeerJS ,這是一個基于 WebRTC 的開源對等聊天框架。對于實時轉錄,您使用 Riva 中的自動語音識別( ASR )。標記成績單中的關鍵短語使用命名實體識別( NER ),也來自 Riva 。我們還向您展示了如何使用來自醫學領域的數據來訓練 NER 模型。
Source
]]>
2250
-
使用 NVIDIA Riva 和 Rasa 創建基于語音的虛擬助理
http://www.open-lab.net/zh-cn/blog/creating-voice-based-virtual-assistants-using-riva-and-rasa/
Tue, 09 Nov 2021 09:35:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2244
Continued]]>
虛擬助理已經成為我們日常生活的一部分。我們問虛擬助理幾乎任何我們想知道的事情。除了為我們的日常生活提供便利之外,虛擬助手在企業應用程序方面也有巨大的幫助。例如,我們使用在線虛擬代理來幫助解決復雜的技術問題、提交保險索賠或預訂酒店。我們還使用全自動呼叫來幫助擴展客戶關系管理。所有這些應用程序都要求企業部署一個生產級、健壯、基于語音的虛擬助手,以擴展到數億最終用戶。 由于其自然性,語音界面已成為促進高質量人機界面的關鍵因素。然而,對于許多開發人員來說,基于語音的虛擬助理仍然是一個重大的技術挑戰,尤其是在大規模部署時。 要成功部署基于語音的生產級虛擬助手,必須確保完全支持以下方面: 這篇文章的目的是讓您了解兩個生產級、企業級、虛擬助手解決方案: NVIDIA Riva 和 Rasa 的示例應用程序。我們展示了您可以輕松構建第一個基于語音的虛擬應用程序,
Source
]]>
2244
-
ICYMI :在 NVIDIA GTC 主題演講上宣布的新 AI 工具和技術
http://www.open-lab.net/zh-cn/blog/icymi-new-ai-tools-and-technologies-announced-at-nvidia-gtc-keynote/
Tue, 09 Nov 2021 08:20:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2161
Continued]]>
今年 11 月在 NVIDIA GTC 上,宣布了新的軟件工具,幫助開發人員構建實時語音應用程序,優化各種用例的推理,優化推薦系統的開源互操作性,等等。觀看首席執行官黃延森( Jensen Huang )的主題演講,了解 NVIDIA 的最新突破。 今天, NVIDIA 推出了具有自定義語音功能的新版NVIDIA Riva。通過 Riva 定制語音,企業可以輕松創建代表其品牌的獨特語音。 NVIDIA 還宣布了 Riva Enterprise ,這是一個付費項目,包括為希望大規模部署 Riva 的企業提供 NVIDIA 專家支持。工作量較小的客戶和合作伙伴可以繼續免費使用 Riva 。 Riva 亮點包括: 今天從NGC catalog中嘗試 Riva ,并注冊NVIDIA Riva Enterprise興趣列表。
Source
]]>
2161
人人超碰97caoporen国产