transcription – NVIDIA 技術博客

語音識別：使用 NVIDIA Riva 生成準確的轉錄

Wed, 10 Nov 2021 07:11:46 +0000

這篇文章是關于生成準確語音轉錄的系列文章的一部分。有關第 2 部分，請參見Speech Recognition: Customizing Models to Your Domain Using Transfer Learning. 有關第 3 部分，請參見Speech Recognition: Deploying Models to Production. 每天，電信、金融和統一通信即服務（ UCaaS ）等行業都會產生數百萬分鐘的音頻。這些音頻會議記錄可以轉錄，以便為呼叫中心代理提供實時建議，從客戶呼叫記錄中提取見解，或在視頻會議中生成實時字幕。自動語音識別使您能夠將語音轉錄成文本。生成高質量的文字記錄是一項挑戰，因為這些技能需要理解特定于行業的術語、數百到數千分鐘特定于領域的培訓音頻以及實時運行的管道。 NVIDIA Riva 語音識別是一項技術，

Source

]]>

語音識別：使用遷移學習為您的領域定制模型

Tue, 09 Nov 2021 10:37:40 +0000

這篇文章是關于生成準確語音轉錄的系列文章的一部分。有關第 1 部分，請參見 Speech Recognition: Generating Accurate Transcriptions Using NVIDIA Riva. 有關第 3 部分，請參見 Speech Recognition: Deploying Models to Production. 從頭開始創建一個新的人工智能深度學習模型是一個非常耗費時間和資源的過程。解決這個問題的一個常見方法是采用遷移學習。為了使這一過程更加簡單，NVIDIA TAO Toolkit，它可以將工程時間框架從 80 周縮短到 8 周。 TAO 工具包支持計算機視覺和對話 AI （ ASR 和 NLP ）用例。在本文中，我們將介紹以下主題：跟隨 download the Jupyter notebook。

Source

]]>

語音識別：將模型部署到生產中

Tue, 09 Nov 2021 10:33:28 +0000

這篇文章是關于生成準確語音轉錄的系列文章的一部分。有關第 1 部分，請參見Speech Recognition: Generating Accurate Transcriptions Using NVIDIA Riva.有關第 2 部分，請參見Speech Recognition: Customizing Models to Your Domain Using Transfer Learning NVIDIA Riva 是一款 AI 語音 SDK ，用于開發實時應用程序，如轉錄、虛擬助理和聊天機器人。它包括 NGC 中經過預訓練的最先進模型、用于在您的領域中微調模型的 TAO 工具包以及用于高性能推理的優化技能。 Riva 使使用 NGC 中的 Riva 容器或使用 Helm chart 在 Kubernetes 上部署模型變得更簡單。 Riva 技能由 NVIDIA TensorRT…

Source

]]>

使用 NVIDIA Riva 構建轉錄和實體識別應用程序

Tue, 09 Nov 2021 09:43:00 +0000

在過去的幾個月里，我們中的許多人已經習慣于通過視頻電話看醫生。這當然很方便，但在通話結束后，醫生的重要建議就開始溜走了。我需要服用什么新藥？有什么副作用需要注意嗎？ Conversational AI 可以幫助構建一個應用程序來轉錄語音，并突出該轉錄本中的重要短語。 NVIDIA Riva 是一款 SDK ，它可以減少您構建和部署可用于這些任務的最先進的深度學習模型的時間。在本文中，我們將向您展示如何構建一個 web 應用程序，該應用程序可以從實時視頻聊天中轉錄語音，并在轉錄本中標記關鍵短語。視頻聊天使用 PeerJS ，這是一個基于 WebRTC 的開源對等聊天框架。對于實時轉錄，您使用 Riva 中的自動語音識別（ ASR ）。標記成績單中的關鍵短語使用命名實體識別（ NER ），也來自 Riva 。我們還向您展示了如何使用來自醫學領域的數據來訓練 NER 模型。

Source

]]>