借助 NVIDIA NeMo Curator 簡化域自適應預訓練的數據處理

Tue, 10 Sep 2024 08:23:26 +0000

大語言模型（LLMs）的領域自適應預訓練（DAPT）是構建特定領域模型的重要步驟。與現成的開放或商用模型相比，這些模型在特定領域任務中表現出更出色的功能。最近，NVIDIA 發表了一篇關于 ChipNeMo 的論文，這是一系列面向工業芯片設計應用的基礎模型。ChipNeMo 模型是通過在專有數據和公開可用的特定領域數據的語料庫上對 Llama 2 系列模型進行持續預訓練的結果。本文將以 ChipNeMo 數據集為例，介紹使用 NVIDIA NeMo Curator 從各種公開來源收集訓練數據集的過程。 NeMo Curator 是一個 GPU 加速的數據 curation 庫，通過準備用于預訓練和自定義的大規模、高質量數據集來提高生成式 AI 模型的性能。 NeMo Curator 通過擴展到多節點多 GPU (MNMG) 來縮短數據處理時間，

Source

]]>

使用 NVIDIA 數學庫加速 GPU 應用程序

Tue, 26 Jul 2022 06:05:00 +0000

加速 GPU 應用程序的主要方法有三種：編譯器指令、編程語言和預編程庫。編譯器指令，例如 OpenACC a 允許您順利地將代碼移植到 GPU 以使用基于指令的編程模型進行加速。雖然它易于使用，但在某些情況下可能無法提供最佳性能。編程語言，例如 CUDA C 和 C ++ 在加速應用程序時為您提供更大的靈活性，但用戶也有責任編寫代碼，利用新的硬件功能在最新的硬件上實現最佳性能。這就是預編程庫填補空白的地方。除了增強代碼的可重用性外，還可以使用 NVIDIA 數學庫優化以充分利用 GPU 硬件，獲得最大的性能增益。如果您正在尋找一種簡單的方法來加速應用程序，請繼續閱讀，了解如何使用庫來提高應用程序的性能。 NVIDIA 數學庫，作為 CUDA 工具包和高性能計算（ HPC ）軟件開發工具包（ SDK ），提供各種計算密集型應用程序中遇到的函數的高質量實現。

Source

]]>

Aastha Jhunjhunwala – NVIDIA 技術博客

借助 NVIDIA NeMo Curator 簡化域自適應預訓練的數據處理

使用 NVIDIA 數學庫加速 GPU 應用程序