自然語言處理 – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Thu, 07 Sep 2023 05:32:41 +0000
zh-CN
hourly
1
196178272 -
用蒸餾法加速文本到語音的擴散模型
http://www.open-lab.net/zh-cn/blog/speeding-up-text-to-speech-diffusion-models-by-distillation/
Fri, 01 Sep 2023 05:29:25 +0000
http://www.open-lab.net/zh-cn/blog/?p=7778
Continued]]>
每年,作為課程的一部分,波蘭華沙大學的學生都會在 NVIDIA 華沙辦事處工程師的監督下,就深度學習和加速計算中的挑戰性問題開展工作。我們展示了三位理學碩士學生——Alicja Ziarko、Pawe? Pawlik 和 Micha? 的TorToiSe,一個多階段、基于擴散的文本到語音(TTS)模型。 Alicja、Pawe? 和 Micha? 首先了解了語音合成和擴散模型的最新進展。他們選擇了 combination,這是 無分類器引導 和 漸進式蒸餾 的一部分,在計算機視覺中表現良好,并將其應用于語音合成。在不降低語音質量的情況下,他們將擴散延遲降低了 5 倍。小型感知語音測試證實了這一結果。值得注意的是,這種方法不需要從原始模型開始進行昂貴的訓練。 自從WaveNet 在 2016 年出現以來,神經網絡已經成為語音合成的主要模型。在一些簡單的應用中,
Source
]]>
7778
-
選擇大型語言模型定制技術
http://www.open-lab.net/zh-cn/blog/selecting-large-language-model-customization-techniques/
Thu, 10 Aug 2023 05:12:36 +0000
http://www.open-lab.net/zh-cn/blog/?p=7609
Continued]]>
大語言模型(LLM)正在成為企業不可或缺的工具,用于改善他們的運營、客戶互動和決策過程。然而,由于行業特定的術語、領域專業知識或獨特的要求,現成的 LLM 往往無法滿足企業的特定需求。 這就是自定義 LLM 發揮作用的地方。 企業需要自定義模型來根據其特定的用例和領域知識定制語言處理能力。自定義 LLM 使企業能夠在特定行業或組織環境中更高效、更準確地生成和理解文本。 定制模型使企業能夠創建符合其品牌聲音的個性化解決方案,優化工作流程,提供更精確的見解,并提供增強的用戶體驗,最終推動市場競爭優勢。 這篇文章介紹了各種模型定制技術以及何時使用它們。 NVIDIA NeMo 支持許多方法。 NVIDIA NeMo 是一個端到端的云原生框架,用于在任何地方構建、定制和部署生成人工智能模型。它包括訓練和推理框架、護欄工具包、數據管理工具和預訓練模型,
Source
]]>
7609
-
使用分布式數據集上的聯合學習使 LLM 適應下游任務
http://www.open-lab.net/zh-cn/blog/adapting-llms-to-downstream-tasks-using-federated-learning-on-distributed-datasets/
Mon, 10 Jul 2023 03:31:27 +0000
http://www.open-lab.net/zh-cn/blog/?p=7364
Continued]]>
大型語言模型( LLM ),如 GPT,由于其理解和生成類人文本的能力,已成為自然語言處理( NLP )中的革命性工具。這些模型基于大量不同的數據進行訓練,使其能夠學習模式、語言結構和上下文關系。它們是基礎模型,可以針對廣泛的下游任務進行定制,具有高度的通用性。 諸如分類之類的下游任務可以包括基于預定義標準對文本進行分析和分類,這有助于諸如情緒分析或垃圾郵件檢測之類的任務。在封閉式問答( QA )中,他們可以根據給定的上下文提供精確的答案。在生成任務中,它們可以生成類似人類的文本,例如故事寫作或詩歌創作。即使是頭腦風暴, LLM 也可以利用其龐大的知識庫產生創造性和連貫性的想法。 LLM 的適應性和多功能性使其成為廣泛應用的寶貴工具,使企業、研究人員和個人能夠以顯著的效率和準確性完成各種任務。 這篇文章向您展示了 LLM 如何使用分布式數據集和聯合學習來適應下游任務,
Source
]]>
7364
-
如何從大型語言模型中獲得更好的輸出
http://www.open-lab.net/zh-cn/blog/how-to-get-better-outputs-from-your-large-language-model/
Wed, 14 Jun 2023 05:19:46 +0000
http://www.open-lab.net/zh-cn/blog/?p=7215
Continued]]>
大語言模型(LLM)因其前所未有的規模理解和處理人類語言的能力,在全球引發轟動,改變了我們與技術互動的方式。 經過大量文本語料庫的訓練, LLM 可以在沒有太多指導或訓練的情況下為各種應用程序操作和生成文本。但是,生成的輸出的質量在很大程度上取決于您給模型的指令,即提示。這對你來說意味著什么?如今,與模型交互是設計提示的藝術,而不是設計模型架構或訓練數據。 考慮到構建和培訓模型所需的專業知識和資源,處理 LLM 可能會付出代價。NVIDIA NeMo 提供了預訓練的語言模型,可以靈活地適應幾乎所有的語言處理任務,同時我們可以完全專注于從可用的 LLM 中獲得最佳輸出。 在本文中,我討論了一些可以充分利用 LLM 的方法。要了解更多關于如何開始使用 LLM 的信息,請參閱《大型語言模型介紹:提示工程和 P-Tuning》。 在我進入生成最佳輸出的策略之前,
Source
]]>
7215
-
借助 NVIDIA FLARE 實現的聯合學習,提升您的人工智能工作流程
http://www.open-lab.net/zh-cn/blog/boost-your-ai-workflows-with-federated-learning-enabled-by-nvidia-flare/
Wed, 14 Jun 2023 05:05:37 +0000
http://www.open-lab.net/zh-cn/blog/?p=7209
Continued]]>
在工作流程中利用人工智能的企業面臨的主要挑戰之一是管理支持大規模培訓和部署機器學習( ML )模型所需的基礎設施。為此,NVIDIA FLARE平臺提供了一個解決方案:聯合學習,使得跨企業管理復雜的人工智能工作流變得更加容易。 NVIDIA FLARE 2.3.0 是 NVIDIA 聯合學習平臺的最新版本,其中包含了令人興奮的新功能和增強功能,如: 這篇文章詳細介紹了這些功能,并探討了它們如何幫助您的組織提升人工智能工作流程,并通過機器學習獲得更好的結果。 有了這個版本,您現在可以使用 IaC 無縫管理您的多云基礎設施,利用不同云提供商的優勢,并分配您的工作負載以提高效率和可靠性。 IaC 使您能夠自動化基礎設施的管理和部署,從而節省時間并降低人為錯誤的風險。 NVIDIA FLARE 2.3.0 支持在 Microsoft Azure 和 AWS…
Source
]]>
7209
-
為全球語言用戶解鎖語音 AI 技術:熱門問答
http://www.open-lab.net/zh-cn/blog/unlocking-speech-ai-technology-for-global-language-users-top-qas/
Tue, 06 Jun 2023 06:50:12 +0000
http://www.open-lab.net/zh-cn/blog/?p=7157
Continued]]>
語音技術正在無處不在地發展。但許多人正被一個以英語為中心、存在人口統計學偏見的算法世界拋在后面。Mozilla Common Voice(MCV)和NVIDIA正在合作,通過開發一個公共眾包多語言語音語料庫和開源預訓練模型來改變這一現狀,該語料庫目前是世界上同類語料庫中最大的。現在比以往任何時候都更容易開發自動語音識別(ASR)技術,以滿足多種語言的使用者。 這篇文章總結了來自于2022年由EM Lewis Jong主演的 Speech AI Summit 和 Mozilla Common Voice 以及NVIDIA 的 Caroline de Brito Gottlieb 在 Unlocking Speech AI Technology for Global Language Users 中提出的錄音講話。 Caroline de Brito Gottlieb:
Source
]]>
7157
-
語音識別如何改善電信客戶服務
http://www.open-lab.net/zh-cn/blog/how-speech-recognition-improves-customer-service-in-telecommunications/
Tue, 02 May 2023 02:09:53 +0000
http://www.open-lab.net/zh-cn/blog/?p=6840
Continued]]>
通信行業近年來人工智能技術激增,語音識別和翻譯首當其沖。多語人工智能虛擬助手,數字人,聊天機器人,代理協助,以及音頻轉錄是正在徹底改變電信行業的技術。企業正在呼叫中心實施人工智能,以加快處理傳入請求,從而大幅改善客戶體驗、員工忠誠度和品牌聲譽。 例如,自動語音識別( ASR ),也稱為語音轉文本,已被用于實時轉錄對話,使企業能夠快速為客戶確定資源或解決方案。Speech AI還被用于分析情緒,確定摩擦源,并提高合規性和代理性能。 這篇文章深入探討了語音識別在電信行業的變革力量,并強調了 AT & T 和T-Mobile正在使用這些最先進的技術在其呼叫中心提供無與倫比的客戶體驗。 語音轉文本技術的實現已經成為客戶服務領域的游戲規則改變者。通過自動化呼叫路由、呼叫分類和語音身份驗證等任務,企業可以大大減少等待時間,并確保客戶能夠找到最合格的代理來處理他們的請求。
Source
]]>
6840
-
NVIDIA 實現值得信賴、安全可靠的大型語言模型對話系統
http://www.open-lab.net/zh-cn/blog/nvidia-enables-trustworthy-safe-and-secure-large-language-model-conversational-systems/
Tue, 25 Apr 2023 05:35:01 +0000
http://www.open-lab.net/zh-cn/blog/?p=6789
Continued]]>
大語言模型( LLM )非常強大,能夠回答復雜的問題,進行創造性的寫作、開發、調試源代碼等。通過將 LLM 應用程序連接到外部工具,例如從實時源讀取數據,或者使 LLM 能夠決定根據用戶的請求采取什么行動,您可以構建極其復雜的 LLM 應用。然而,以安全可靠的方式構建這些 LLM 應用程序具有挑戰性。 NeMo Guardrails 是一個開源工具包,用于輕松開發安全可靠的 LLM 會話系統。由于生成人工智能的安全性是全行業關注的問題, NVIDIA 設計 NeMo Guardrails 與所有 LLM 一起工作,包括 OpenAI 的 ChatGPT 。 該工具包由社區構建的工具包提供支持,如 LangChain ,它在短短幾個月內就在 GitHub 上聚集了約 3 萬顆星。工具包提供了可組合、易于使用的模板和模式,通過將 LLM 、
Source
]]>
6789
-
大型語言模型簡介:提示工程和 P 調優
http://www.open-lab.net/zh-cn/blog/an-introduction-to-large-language-models-prompt-engineering-and-p-tuning/
Sun, 23 Apr 2023 04:54:48 +0000
http://www.open-lab.net/zh-cn/blog/?p=6778
Continued]]>
ChatGPT 給人留下了深刻印象。用戶很樂意使用人工智能聊天機器人提問、寫詩、塑造互動角色、充當個人助理等等。大語言模型( LLM )為 ChatGPT 供電,這些模型就是本文的主題 在更仔細地考慮 LLM 之前,我們首先想確定語言模型的作用。語言模型給出了一個單詞在單詞序列中有效的概率分布。從本質上講,語言模型的工作是預測哪個詞最適合一個句子。圖 1 提供了一個示例。 雖然像 BERT 這樣的語言模型已經被有效地用于處理文本分類等許多下游任務,但已經觀察到,隨著這些模型規模的增加,某些額外的能力也會出現 這種規模的增加通常伴隨著以下三個維度的相應增加:參數的數量、訓練數據和訓練模型所需的計算資源。有關詳細信息,請參閱Emergent Abilities of Large Language Models. LLM 是一種深度學習模型,可以使用大型數據集識別、
Source
]]>
6778
人人超碰97caoporen国产