隨著全球服務經濟的發展,公司越來越依賴于聯系中心來改善客戶體驗,提高客戶滿意度,降低成本并提高效率。客戶需求的增長速度遠遠超過了聯絡中心的就業率。與高代理流失率相結合,客戶需求產生了對更自動化的實時客戶通信的需求,從而增強了代理的能力。
研究人員早在 20 世紀 70 年代就認識到了這些趨勢,并開始開發可通過觸音電話導航的原始語音菜單。雖然語音菜單可能會回答常見問題,并減輕聯絡中心代理的壓力,但客戶通常會發現與他們互動令人沮喪。
由于以下任何原因,您可能是想要直接與代理通話的來電者之一,而不是收聽多層預先錄制的語音提示:
- 聆聽最符合您查詢的菜單選項需要時間。此外,在您聯系聯系中心代理后,您的問題可能非常復雜,無法在一次通話中解決。
- 您的問題可能與菜單選項不匹配,或者可能屬于多個選項。
- 您和聯絡中心代理可能不會說相同的母語,特別是當聯絡中心外包給另一個國家時。
- 有些聯絡中心可能在您方便的時間沒有工作人員。
為了有效解決這些問題,公司已開始將智能虛擬助理(也稱為 AI 虛擬助理)集成到其聯絡中心解決方案中。
在本篇文章中,我們概述了如何使用 NVIDIA 聯絡中心智能虛擬助理工作流和組件(如 NVIDIA Riva 語音技術和 speech AI 技能)構建和部署聯絡中心智能智能虛擬助理:
- 自動語音識別( ASR )或語音到文本( STT )
- 文本轉語音( TTS )
減少智能虛擬助理應用程序的開發時間
智能虛擬助理是一種 AI 驅動的軟件,它可以識別人類的語音,理解意圖,并在與客戶交談時以類似人類的聲音提供精確和個性化的響應。
智能虛擬助理 24 小時收集客戶信息和通話原因,并管理客戶問題,而無需現場代理。對于復雜的情況,這些信息會自動為現場代理準備,以通過個人接觸優化服務客戶。
您可以使用 NVIDIA Riva 語音 AI 構建塊創建 intelligent virtual assistant applications 。為了縮短開發時間,您可以利用 NVIDIA 聯絡中心智能虛擬助理工作流程和集成的 Riva 技能。
此 NVIDIA AI 解決方案工作流為您提供了一個無需準備即可開始的參考,幫助您更快地實現所需的 AI 結果。
NVIDIA 聯絡中心智能虛擬助理工作流程和組件
NVIDIA 聯絡中心智能虛擬助理工作流(圖 1 )被設計為一個微服務,這意味著它可以單獨部署在 Kubernetes 上,也可以與其他微服務一起部署,以創建一個生產就緒的應用程序,實現無縫擴展。

如何集成服務和對話管理器以進行部署
該工作流將 NVIDIA Riva ASR 和 TTS 服務與 Haystack (第三方開源自然語言信息檢索問題解答( NLP IRQA )服務)和 Rasa (開源對話管理器)集成。
圖 1 顯示了 Riva ASR 服務轉錄用戶的口頭問題。 Rasa 和 Haystack 用于解釋用戶在問題中的意圖,并構建相關的回答。該響應使用 Riva TTS 以合成的自然語音傳遞給用戶。
就上下文而言, NVIDIA Riva 提供了工具,用于構建和 deploying 對話式 AI 和語音 AI 管道,以連接到任何包含 NVIDIA GPU 的設備,無論是邊緣設備、數據中心還是云端設備。這些工具還使用這些管道進行推理。
針對金融行業的特定語言定制
NVIDIA 聯絡中心智能虛擬助理工作流具有針對金融服務行業用例的 Riva ASR 自定義功能。
這些 Riva ASR 定制在兩個示例 Jupyter 筆記本中執行:
- 提高對金融特定條款的認可。
- 在具有挑戰性的聲學環境(包括噪音、口音和方言)中增強對金融術語的識別。
- 為金融專用詞的發音提供明確的指導。
有關自定義 Riva ASR 模型的詳細信息,請參見 ASR Customization Best Practices 。
對話管理器培訓和 IRQA 組件
在 Riva ASR 定制之后,您可以在智能虛擬助理對話框管理器上使用信息檢索和問題解答( IRQA )組件。每個智能虛擬助理都需要一種管理會話狀態和流程的方法。
對話管理器使用類似 BERT 的語言模型來識別從 Riva ASR 服務獲得的轉錄文本中的用戶意圖。然后,它將問題路由到正確準備的響應或履行服務。這為問題提供了上下文,并為智能虛擬助理如何給出正確的響應提供了框架。
Rasa 對話管理器還通過填充開發人員設置的用于記住對話上下文的槽來維護對話狀態。它可以通過提供每個意圖和要識別的插槽的幾個示例來訓練以理解用戶意圖。
使用 Haystack NLP 的 IRQA 然后用于搜索給定文檔的列表,并生成對用戶問題的長格式響應。這有助于公司處理大量非結構化數據,這些數據需要以對客戶有幫助的形式使用。 IRQA 生成答案后, Riva TTS 合成一個類似人類的音頻響應。
總之, NVIDIA 聯絡中心智能虛擬助理工作流可以作為 Helm 圖表的集合部署在任何云 Kubernetes 發行版上,每個圖表都運行一個微服務。
雖然 NVIDIA 聯絡中心智能虛擬助理架構使用 Haystack 和 Rasa 組件,但您可以使用首選組件。
所有 NVIDIA 聯絡中心智能虛擬助理工作流打包組件都包括企業級實施最佳實踐,包括身份驗證、監控、報告和負載平衡,同時支持定制。
基于使用度量的最優推理
NVIDIA 聯絡中心智能虛擬助理工作流包括 NVIDIA Triton Inference Server ,它為 Prometheus 提供指示 GPU 和請求統計的度量。度量格式為純文本,因此您可以直接在 Grafana 儀表板中查看它們。
基于 Triton 推理服務器 metrics ,我們計算了對 Riva 而言特定且重要的度量(表 1 )。
Metric name | Metrics formula | Definition |
Average queue time | avg(delta(nv_inference_queue_duration_us[1m])/(1+delta(nv_inference_request_success[1m]))/1000) |
請求在 Triton 推理服務器隊列中停留的時間(以毫秒為單位)是一分鐘時間窗口內所有請求的平均值。這是衡量服務器計算能力的指標。如果這增加超過閾值,請考慮將您的服務器擴展到更多副本。 |
Number of successful requests per minute | sum(delta(nv_inference_request_success[1m])) |
在一分鐘時間窗口內捕獲的成功推理請求總數。 |
Number of failed requests per minute | sum(delta(nv_inference_request_failure[1m])) |
在一分鐘時間窗口內捕獲的成功推理請求總數。 |
P99 latency in seconds | quantile_over_time(0.99, nv_inference_compute_infer_duration_us[1m]) / 1000 / 1000 |
在一分鐘的時間窗口內捕獲的所有請求樣本的 p99 ASR 延遲。 |
P95 latency in seconds | quantile_over_time(0.95, nv_inference_compute_infer_duration_us[1m]) / 1000 / 1000 |
在一分鐘的時間窗口內捕獲的所有請求樣本的 p95 ASR 延遲。 |
GPU memory utilization | avg(nv_gpu_memory_used_bytes / 1024 / 1024 / 1024) |
Riva 服務器使用的 GPU 內存。 |
Number of Riva Servers | count (count by (instance) (nv_cache_hit_lookup_duration_per_model)) |
Kubernetes 集群上的 Riva 服務器副本。 |
GPU Utilization | avg(nv_gpu_utilization) |
平均 GPU 利用率。 |
GPU Power Utilization | avg(nv_gpu_power_usage) |
一段時間內的 GPU 功耗。 |
根據這些使用指標, Riva 吊艙可以手動或自動縮放。
結論
NVIDIA Riva 提供語音 AI 工具,使公司能夠在聯絡中心構建和部署智能虛擬助理。這些助手減輕了人工代理的壓力,同時也為客戶提供了他們期望從現場員工那里獲得的互動和個人待遇。這一切都會帶來更好的客戶體驗。
智能虛擬助理還可以通過減少客戶等待時間、提供實時翻譯、更快地解決客戶難題、縮短代理入職時間,并使客戶能夠全天候到達聯絡中心,從而顯著提高聯絡中心的效率。公司還可以使用聯絡中心通話記錄來進一步完善其產品和服務。
相關資源
NVIDIA 聯絡中心智能虛擬助理工作流將于 12 月底在 NGC 上為 NVIDIA AI Enterprise 軟件客戶提供。
同時,您可以注冊 NVIDIA LaunchPad 以獲得實踐經驗,并立即使用必要的硬件和軟件堆棧來測試和原型化基于會話的解決方案。工作流解決方案將于 2023 年 1 月 20 日開始在 LaunchPad 上提供。
有關使用 Riva 語音 AI 服務增強聯系中心的分步說明,請參閱網絡研討會 How to Build and Deploy an AI Voice-Enabled Virtual Assistant for Financial Services Contact Centers 。
要了解真正的公司如何在其聯絡中心從 Riva 語音 AI 技能中獲益,請參閱 T-Mobile 和 Floatbot 用例故事。
?