• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 3 月 19 日下午 2 點,鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看
    生成式人工智能/大語言模型

    借助 NVIDIA NeMo 定制器輕松微調和對齊 LLM

    隨著 大型語言模型(LLM) 在企業 AI 應用中獲得更多吸引力,定制化模型?理解和集成特定行業術語、領域專業知識和獨特的組織要求變得越來越重要。

    為滿足對自定義 LLM 的日益增長的需求,NVIDIA NeMo 團隊宣布 NeMo Customizer 搶先體驗計劃。這是一種高性能、可擴展的微服務,可簡化 LLM 的微調和對齊。

    使用 NeMo Customizer 調整生成式 AI

    企業可以利用 NVIDIA NeMo 來開發自定制的生成式 AI 平臺,包括訓練、微調、檢索增強生成 (RAG)、guardrailing 和數據管護等功能。NeMo 提供從框架到更高級別的 API 端點,以簡化開發過程。它提供了預訓練模型和技術堆棧,以幫助企業快速開發和部署具有特定功能的生成式 AI 模型。

    NeMo Customizer 微服務是一組基于 NeMo 框架的 API 端點,旨在為企業提供快速、經濟高效地微調 Large Language Model (LLM) 的最簡單方法,以促進生成式 AI 的采用。

    搶先體驗中提供的自定義技術

    該微服務最初支持兩種流行的參數高效微調技術:低級適應 (LoRA) 和 P-tuning。

    LoRA

    借助 LoRA 技術,原始模型參數會被凍結,并注入可訓練的秩分解矩陣。這將可訓練參數的數量減少 10K 倍,GPU 需求減少 3 倍。可以針對不同的任務訓練多個小型 LoRA 模塊,從而無需創建多個微調模型。NeMo 還提供了在用戶認為必要時將可訓練矩陣與原始權重合并的選項。

    P 調優

    借助 P-tuning,企業應用程序開發者可以向 LLM 添加新的任務功能,而不會覆蓋或中斷 LLM 已學習的先前任務。

    針對這種定制技術,LLM 參數會被凍結,長短期記憶 (LSTM) 或多層感知器 (MLP) 模型稱為 *提示編碼器* 用于預測虛擬令牌嵌入。這些虛擬令牌并不代表 LLM 的任何詞匯表,純粹是為了調整目的而學習的。

    完全對齊技術

    除了這些參數高效的微調技術之外,NeMo Customizer 微服務還將在未來添加對完全對齊技術的支持,包括:

    • 監督式微調 (SFT)
    • 從人類反饋中進行強化學習 (RLHF)
    • 直接偏好優化 (DPO)
    • NVIDIA SteerLM:簡單且實用的技術,可定制大型語言模型(LLM)的推理過程。

    同時,NeMo-Aligner GitHub 庫可用于那些希望完整模型比對的人。這也是 NeMo 框架容器 NGC 目錄的一部分。

    NeMo 定制器的優勢

    NeMo Customizer 通過利用可快速部署的微服務來簡化 LLM 定制,使用并行技術加速訓練性能,并擴展到多 GPU 和多節點。此外,您可以隨時隨地下載和部署這些微服務,確保靈活性和對開發流程的控制,同時保持數據安全性。

    加快上市時間

    利用熟悉的微服務和 API 架構加速開發周期,并加快產品上市速度。

    這些微服務提供了靈活性和互操作性,并且可以作為 API 無縫集成到現有工作流程中,而無需考慮所使用的底層技術。

    圖 1 顯示了 cURL 命令示例和來自 NeMo Customizer 微服務的響應。

    An image of Jupyter Notebook cells demonstrating the customization of a model using the Nemo Customization microservice.
    圖 1.Jupyter Notebook 單元,展示了如何使用 NeMo 自定義微服務自定義模型

    加速性能和可擴展性

    利用多種并行技術可減少這些 LLM 所需的訓練時間。由于 LLM 支持多 GPU 和多節點架構,因此可以訓練更大的模型。這些方法協同工作以增強訓練過程,從而確保優化資源利用并提高訓練性能。

    隨處自定義

    您可以下載 NeMo Customizer 微服務,并在您喜歡的基礎架構上運行,這意味著您不依賴于任何特定的提供商。這為您提供了更多的自由和對開發設置的控制。

    對于處理敏感數據的企業而言,基礎設施靈活性是一個巨大的優勢,因為他們可以通過將所有內容都保留在本地來保持更嚴格的控制和安全性。這可以確保敏感信息始終受到保護,免受可能在外部平臺上發生的潛在風險或漏洞的影響。

    例如,如 “使用機密計算保護敏感數據和 AI 模型” 中所述,銀行環境中的客戶財務數據必須保密且安全。生成敏感和個人身份信息 (PII) 的活動示例包括信用卡交易、醫學影像或其他診斷測試、保險索賠和貸款申請。

    此外,NeMo Customizer 微服務支持 Kubernetes 可訪問類似 NFS 的文件系統和火山調度程序。這允許批量調度,這是高性能多節點微調 LLM 通常所需的功能。

    注冊以搶先體驗

    作為 NVIDIA NeMo 微服務搶先體驗的一部分,您可以在請求訪問以下微服務:NeMo CuratorNeMo Evaluator。這些微服務可以跨任何云或數據中心輕松地進行學術和自定義基準測試,提供對自定義生成式 AI 模型的數據管護和自動評估。這些微服務組合在一起,使企業能夠輕松構建企業級自定義生成式 AI,并以更快的速度將解決方案推向市場。

    首先,請申請 NeMo Customizer 搶先體驗 系統。申請獲得批準后,您將收到訪問微服務容器的鏈接。

    ?

    標簽

    人人超碰97caoporen国产