Automatic Speech Recognition (ASR)

2023年 2月 8日
演講 AI 聚光燈:Pendulum 如何在網上捕捉有害的敘述
超過 55% 的全球人口使用社交媒體,只需單擊一下即可輕松分享在線內容。在與他人聯系并消費娛樂內容的同時,
2 MIN READ

2023年 2月 3日
語音識別模型對新領域的受控適應
你有沒有試過在你的口音上微調語音識別系統,結果發現,雖然它能很好地識別你的聲音,但卻無法檢測到別人說的話?
2 MIN READ

2023年 1月 31日
基于 NVIDIA NeMo 的多語言和代碼切換自動語音識別
多語言 自動語音識別 ( ASR )模型因其能夠以多種語言轉錄語音而獲得了極大的興趣。這是由不斷增長的多語言社區以及減少復雜性的需求所推動的。
2 MIN READ

2023年 1月 13日
基于熵的字級 ASR 置信度估計方法
一旦您有了自動語音識別( ASR )模型預測,您可能還想知道這些預測正確的可能性。這種正確率或置信度通常作為原始預測概率(快速、
4 MIN READ

2023年 1月 12日
使用 Kubernetes 自動縮放 NVIDIA Riva 部署,用于生產中的語音 AI
語音 AI 應用,從呼叫中心到虛擬助理,嚴重依賴 自動語音識別 ( ASR )和文本轉語音( TTS )。
4 MIN READ

2022年 12月 16日
深度學習正在改變 ASR 和 TTS 算法
語音是與 AI 驅動的應用程序通信的主要手段之一。從虛擬助理到數字化身,基于語音的界面正在改變我們通常與智能設備的交互方式。
1 MIN READ

2022年 12月 16日
語音 AI 技術實現與服務機器人的自然交互
從在餐廳點菜、為您提供食物,到與您一起玩撲克,服務機器人正變得越來越普遍。在全球范圍內,您可以在醫院、機場和零售店找到這些服務機器人。
2 MIN READ

2022年 12月 15日
縮短聯絡中心智能虛擬助理的開發時間
隨著全球服務經濟的發展,公司越來越依賴于聯系中心來改善客戶體驗,提高客戶滿意度,降低成本并提高效率。
2 MIN READ

2022年 12月 14日
語音 AI 聚焦:用虛擬代理重塑客戶服務
虛擬代理或語音助手已經存在了很長一段時間。但在過去的十年中,隨著 AI 的使用,它們的實用性和流行性急劇增長。 根據 Gartner 的數據,
1 MIN READ

2022年 10月 28日
為新語言創建的 NVIDIA Riva ASR 服務
Speech AI 是智能系統使用語音接口與用戶進行通信的能力,語音接口在日常生活中已變得無處不在。人們經常通過語音與智能家居設備、
3 MIN READ

2022年 10月 20日
構建基尼亞盧旺達語的自動語音識別模型
語音識別技術在語音助手和機器人、通過輔助醫療或教育解決現實世界問題等方面越來越受歡迎。這有助于實現全球 speech AI 接入的民主化。
2 MIN READ

2022年 9月 22日
語音 AI 機器人的低代碼構建塊
在研究復雜的語音人工智能機器人系統時,開發人員很容易被其復雜性嚇倒。亞瑟· C ·克拉克聲稱:“任何足夠先進的技術都無法與魔法區分開來。”…
2 MIN READ

2022年 9月 16日
通過多尺度說話人分解實現動態尺度加權
說話人日記化是按說話人標簽對錄音進行分段的過程,旨在回答“誰在何時發言?”。與語音識別相比,它有著明顯的區別。 在你執行說話人日記化之前,
2 MIN READ

2022年 9月 16日
使用 NVIDIA NeMo 進行文本規范化和反向文本規范化
文本規范化( TN )將文本從書面形式轉換為口頭形式,是文本到語音( TTS )之前的一個重要預處理步驟。
3 MIN READ

2022年 9月 14日
使用語音 AI 開發下一代擴展現實應用程序
由于身臨其境的體驗,虛擬現實( VR )、增強現實( AR )和混合現實( MR )環境可以感覺到難以置信的真實。在擴展現實( XR…
4 MIN READ