• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 3 月 19 日下午 2 點,鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看
    人工智能/深度學習

    使用多種語言創建語音 AI 應用程序,并使用 Riva 自定義文本到語音

    本月, NVIDIA 在 Riva 中發布了西班牙語、德語和俄語的世界級語音到文本模型,為企業在全球部署語音 AI 應用提供了動力。此外,企業現在可以使用 Riva 的可定制文本到語音管道創建富有表現力的語音界面。

    NVIDIA Riva 是一款 GPU 加速語音 AI SDK ,用于開發實時應用程序,如實時字幕、向基于文本的聊天機器人添加語音,以及在呼叫中心生成實時轉錄。為了便于實施, Riva 在 NGC 目錄中提供了高度精確的預訓練模型。

    TAO 工具包 ,這些模型可以為任何行業定制,包括電信、金融、統一通信即服務和醫療保健。開發者可以使用 Riva 開箱即用地部署這些模型。它們經過優化,可以在云、數據中心和邊緣在不到 300 毫秒的時間內實時運行。

    Riva 發布亮點包括

    • 西班牙語、德語和俄語的世界級語音識別技能。
    • 可定制的文本到語音管道,用于表達性互動。
    • TAO 工具包的低代碼微調工作流。

    多種語言的自動語音識別

    從呼叫中心到虛擬助手,每一個對話人工智能應用程序都嚴重依賴于自動語音識別。企業可以通過 Riva 英語、西班牙語、德語和俄語的自動語音識別在全球范圍內擴展這些應用程序。

    This demo show's NVIDIA Riva world-class automatic speech recognition, now available in multiple languages.
This demo show's NVIDIA Riva world-class automatic speech recognition, now available in multiple languages.
    圖 1:NVIDIA Riva 世界級的自動語音識別系統有英語、西班牙語、德語和俄語版本。

    非英語自動語音識別模型是在各種開源數據集(如 Mozilla Common Voice )以及私有數據集上訓練的。 Riva 開發自動語音識別模型是為了提供開箱即用的準確度,并作為適應行業、行話、方言甚至嘈雜環境的良好起點。在流行的評估數據集上,這些模型在多個行業應用中提供了世界級的準確性。

    可定制的文本到語音管道

    為了讓客戶享受逼真的對話,語音應用程序必須提供類似人類的表情。使用 FASTROPE ,NVIDIA 語音 AI 研究小組創建的新模型 Riva 幫助開發者定制文本到語音管道并創建表達性語音接口。例如,在推理過程中,開發人員可以使用 SSML 標簽改變語音音調和速度。

    ALT Text: This demo shows NVIDIA Riva customizable text-to-speech capabilities, allowing developers to vary voice pitch and speed using SSML tags.ALT Text: This demo shows NVIDIA Riva customizable text-to-speech capabilities, allowing developers to vary voice pitch and speed using SSML tags.
    圖 2:NVIDIA Riva 提供了可定制的文本到語音管道,用于更具表現力的交互。

    最新的最先進的模型,比如里瓦的 Fastpitch ,幫助文本到語音管道的運行速度比市場上其他競爭對手快幾倍。

    資源

    訂閱 NVIDIA 開發者博客 以了解所有對話 AI / NLP 的最新信息。

    ?

    0

    標簽

    人人超碰97caoporen国产