Automatic Speech Recognition (ASR)

2024年 1月 9日

在 GPU 上高效部署語音 AI 模型

導讀：本文將介紹如何在GPU上高效地部署語音AI模型，主要內容如下：

3 MIN READ

2023年 2月 8日

演講 AI 聚光燈：Pendulum 如何在網上捕捉有害的敘述

超過 55% 的全球人口使用社交媒體，只需單擊一下即可輕松分享在線內容。在與他人聯系并消費娛樂內容的同時，

2 MIN READ

2023年 2月 3日

語音識別模型對新領域的受控適應

你有沒有試過在你的口音上微調語音識別系統，結果發現，雖然它能很好地識別你的聲音，但卻無法檢測到別人說的話？

2 MIN READ

2023年 1月 31日

基于 NVIDIA NeMo 的多語言和代碼切換自動語音識別

多語言自動語音識別（ ASR ）模型因其能夠以多種語言轉錄語音而獲得了極大的興趣。這是由不斷增長的多語言社區以及減少復雜性的需求所推動的。

2 MIN READ

2023年 1月 13日

基于熵的字級 ASR 置信度估計方法

一旦您有了自動語音識別（ ASR ）模型預測，您可能還想知道這些預測正確的可能性。這種正確率或置信度通常作為原始預測概率（快速、

4 MIN READ

2023年 1月 12日

使用 Kubernetes 自動縮放 NVIDIA Riva 部署，用于生產中的語音 AI

語音 AI 應用，從呼叫中心到虛擬助理，嚴重依賴自動語音識別（ ASR ）和文本轉語音（ TTS ）。

4 MIN READ

2022年 12月 16日

深度學習正在改變 ASR 和 TTS 算法

語音是與 AI 驅動的應用程序通信的主要手段之一。從虛擬助理到數字化身，基于語音的界面正在改變我們通常與智能設備的交互方式。

1 MIN READ

2022年 12月 16日

語音 AI 技術實現與服務機器人的自然交互

從在餐廳點菜、為您提供食物，到與您一起玩撲克，服務機器人正變得越來越普遍。在全球范圍內，您可以在醫院、機場和零售店找到這些服務機器人。

2 MIN READ

2022年 12月 15日

縮短聯絡中心智能虛擬助理的開發時間

隨著全球服務經濟的發展，公司越來越依賴于聯系中心來改善客戶體驗，提高客戶滿意度，降低成本并提高效率。

2 MIN READ

2022年 12月 14日

語音 AI 聚焦：用虛擬代理重塑客戶服務

虛擬代理或語音助手已經存在了很長一段時間。但在過去的十年中，隨著 AI 的使用，它們的實用性和流行性急劇增長。根據 Gartner 的數據，

1 MIN READ

2022年 10月 28日

為新語言創建的 NVIDIA Riva ASR 服務

Speech AI 是智能系統使用語音接口與用戶進行通信的能力，語音接口在日常生活中已變得無處不在。人們經常通過語音與智能家居設備、

3 MIN READ

2022年 10月 20日

構建基尼亞盧旺達語的自動語音識別模型

語音識別技術在語音助手和機器人、通過輔助醫療或教育解決現實世界問題等方面越來越受歡迎。這有助于實現全球 speech AI 接入的民主化。

2 MIN READ

2022年 9月 22日

語音 AI 機器人的低代碼構建塊

在研究復雜的語音人工智能機器人系統時，開發人員很容易被其復雜性嚇倒。亞瑟· C ·克拉克聲稱：“任何足夠先進的技術都無法與魔法區分開來。”…

2 MIN READ

2022年 9月 16日

通過多尺度說話人分解實現動態尺度加權

說話人日記化是按說話人標簽對錄音進行分段的過程，旨在回答“誰在何時發言？”。與語音識別相比，它有著明顯的區別。在你執行說話人日記化之前，

2 MIN READ

2022年 9月 16日

使用 NVIDIA NeMo 進行文本規范化和反向文本規范化

文本規范化（ TN ）將文本從書面形式轉換為口頭形式，是文本到語音（ TTS ）之前的一個重要預處理步驟。

3 MIN READ

2022年 9月 14日

使用語音 AI 開發下一代擴展現實應用程序

由于身臨其境的體驗，虛擬現實（ VR ）、增強現實（ AR ）和混合現實（ MR ）環境可以感覺到難以置信的真實。在擴展現實（ XR…

4 MIN READ