EM Lewis-Jong – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。Thu, 08 Jun 2023 06:56:52 +0000zh-CN
hourly
1 196178272為全球語言用戶解鎖語音 AI 技術:熱門問答
http://www.open-lab.net/zh-cn/blog/unlocking-speech-ai-technology-for-global-language-users-top-qas/
Tue, 06 Jun 2023 06:50:12 +0000http://www.open-lab.net/zh-cn/blog/?p=7157Continued]]>語音技術正在無處不在地發展。但許多人正被一個以英語為中心、存在人口統計學偏見的算法世界拋在后面。Mozilla Common Voice(MCV)和NVIDIA正在合作,通過開發一個公共眾包多語言語音語料庫和開源預訓練模型來改變這一現狀,該語料庫目前是世界上同類語料庫中最大的。現在比以往任何時候都更容易開發自動語音識別(ASR)技術,以滿足多種語言的使用者。 這篇文章總結了來自于2022年由EM Lewis Jong主演的 Speech AI Summit 和 Mozilla Common Voice 以及NVIDIA 的 Caroline de Brito Gottlieb 在 Unlocking Speech AI Technology for Global Language Users 中提出的錄音講話。 Caroline de Brito Gottlieb: