通信行業近年來人工智能技術激增,語音識別和翻譯首當其沖。多語人工智能虛擬助手,數字人,聊天機器人,代理協助,以及音頻轉錄是正在徹底改變電信行業的技術。企業正在呼叫中心實施人工智能,以加快處理傳入請求,從而大幅改善客戶體驗、員工忠誠度和品牌聲譽。
例如,自動語音識別( ASR ),也稱為語音轉文本,已被用于實時轉錄對話,使企業能夠快速為客戶確定資源或解決方案。Speech AI還被用于分析情緒,確定摩擦源,并提高合規性和代理性能。
這篇文章深入探討了語音識別在電信行業的變革力量,并強調了 AT & T 和T-Mobile正在使用這些最先進的技術在其呼叫中心提供無與倫比的客戶體驗。
語音轉文本對改善客戶服務的影響
語音轉文本技術的實現已經成為客戶服務領域的游戲規則改變者。通過自動化呼叫路由、呼叫分類和語音身份驗證等任務,企業可以大大減少等待時間,并確保客戶能夠找到最合格的代理來處理他們的請求。
語音識別也可以作為人工智能驅動的客戶反饋分析的一部分,有助于提高客戶滿意度、產品和服務。通過語音到文本的人工智能應用程序,公司可以準確識別客戶需求并及時解決。
在他的GTC 演講中, AT&T 的 AVP 數據科學人工智能 Jeremy Fix 概述了他們實施人工智能以改善呼叫中心體驗的關鍵原因:
- 優化人力資源
- 個性化客戶體驗
- 協助其代理人提出可行的見解
資源優化
呼叫中心的一個關鍵組成部分是充足的人員配置。這包括吸引和留住最優秀的人才。使用人工智能, AT&T 可以預測呼叫供應和需求,為代理商提供最佳表現所需的支持。
個性化
通過了解客戶第一次連接時的意圖, AT&T 可以將來電者與經驗豐富的代理商進行匹配,這些代理商以前解決過類似問題,并在正確的時間向客戶提供了相關優惠。
代理人協助
通過將呼叫轉錄和自然語言處理( NLP )驅動的洞察引擎相結合, AT&T 可以為代理人及其經理提供實時可操作的洞察。這些見解使他們能夠做出明智的決策,并提供卓越的客戶服務(視頻 1 )。
這是如何實時工作的?在通話過程中, AT&T 的 NLP 引擎使用實時轉錄和文本挖掘來識別所討論的主題。它推薦下一個最佳行動,識別呼叫情緒,預測客戶滿意度,甚至衡量代理質量和合規性。
常見的語音到文本準確性挑戰
盡管語音 AI 可以顯著改善您的呼叫中心,成功實施語音轉文本面臨一些挑戰,正如 T-Mobile 首席機器學習工程師 Heather Nolis 在 GTC 期間所討論的那樣:
- 語音歧義
- 多樣化的演講風格
- 嘈雜的環境
- 電話的局限性
- 特定領域詞匯
語音歧義
你接到電話誤解別人多少次了?你說的是“識別語音”還是“破壞一個美麗的海灘”?當單詞聽起來相同,但含義不同時,這被稱為語音歧義。如果語音到文本沒有經過訓練來識別上下文中的單詞,這可能會導致錯誤的轉錄。
多樣化的演講風格
每個人嘴里也可能有不同的口音、方言和生理差異,這意味著我們發音的每個單詞聽起來都不一樣。對于在全球運營的聯絡中心,必須在您的訓練數據集中捕捉這些細微差別,以提高語音識別的準確性。
嘈雜的環境
呼叫中心客戶 – 代理的對話可能包括背景噪音、同時揚聲器、麥克風質量低,甚至手機接收不良,這些都可能導致電話中的聲音丟失。當部署在聯絡中心時,穩健的語音轉文本必須能夠承受這種類型的環境。
電話的局限性
電話限制,包括無法記錄某些聲音,如“ s ”和“ f ”,可能會進一步阻礙語音到文本的準確性。例如,當你在打電話,聽到“整個星期五都有空”時,你實際上并沒有聽到“ f ”,因為這個聲音不是通過電話發送的,你的大腦會填充“ f ”。對于轉錄,語音到文本模型會填充缺失的聲音。
特定領域詞匯
為企業創建的每個聯絡中心都由企業情況組成,其中? 主題和詞匯各不相同。開箱即用的 ASR 解決方案在現實生活中很少有用,因為它們通常缺乏有意義的定制。
在 GTC 上, T-Mobile 展示了他們的創新語音識別挑戰的解決方案使用的NVIDIA Riva,一個 GPU 加速 SDK ,用于構建和部署自定義語音應用程序,以及NVIDIA NeMo for fine-tuning基于其領域特定數據。 T-Mobile 在不同口音、說話風格和嘈雜的生產環境中將語音識別精度提高了 3 倍(圖 1 )。

最佳語音轉文本的首要考慮因素
從電信聯絡中心和緊急服務到視頻會議和廣播,企業在實施尖端語音人工智能技術時必須考慮許多因素——準確性、延遲、可擴展性、安全性和運營成本,才能在競爭中保持領先。
企業正在不斷尋找將呼叫中心轉變為價值中心的新方法。在這方面,成本起著重要作用。在處理大量呼叫時,企業必須根據定價模型、總擁有成本( TCO )和隱藏成本來評估供應商。
實現全面的語言、口音和方言覆蓋對于所有語言的語音識別準確性至關重要。幸運的是,語音人工智能在多語言準確性方面取得了重大進展。例如Riva現在提供世界級的英語、西班牙語、普通話、印地語、俄語、阿拉伯語、日語、韓語、德語、葡萄牙語、法語和意大利語語音識別。
最后,語音 AI 模型必須實現低延遲,才能為代理和客戶提供更好的實時體驗。例如,如果代理正在與客戶進行對話,而人工智能沒有足夠快地建議代理的下一步行動,那么它就沒有任何作用。
在 GTC , T-Mobile 提供了他們speech-to-text evaluation process他們的發現非常顯著: Riva 語音識別在延遲、成本效益和準確性方面優于現成的云提供商模
最近Leading the Way with Cutting-Edge Speech AI TechnologyGTC 小組、 Infosys 、 Quantiphi 和摩托羅拉分享了他們在電信行業實施語音人工智能解決方案時解決這些因素的經驗。
主要收獲
將語音和翻譯人工智能集成到客戶服務的人工智能解決方案中,已經成為電信公司的游戲規則改變者。通過使用客戶對話的實時多語言轉錄,電信公司可以更好地對電話進行分類和路由,并向代理商提供有價值的見解和個性化建議。
采用這項技術的電信公司可以通過提供卓越的客戶體驗、在競爭中保持領先地位以及滿足客戶不斷變化的需求,從而在市場上獲得競爭優勢。
要了解更多關于語音和翻譯人工智能如何改變電信公司客戶體驗的信息,請加入我們How Telcos Transform Customer Experiences with Conversational5 月 31 日的網絡研討會,以及技術深潛Empower Telco Contact Center Agents with Multi-Language Speech-AI-Customized Agent Assists6 月 7 日的網絡研討會。向專家學習,在構建自己的人工智能客戶服務解決方案方面獲得寶貴見解。
?