?
NVIDIA 向開發者透露了 AI 軟件套件的主要更新,包括 JAX 、 NVIDIA CV-CUDA 和 NVIDIA RAPIDS 。
要了解 NVIDIA SDK 的最新進展,請觀看首席執行官黃延森(黃仁勛)發布的 主題演講?。
JAX 是 NVIDIA AI
就在今天的 GTC 2022 年, NVIDIA 在 NVIDIA -AI 上引入了 JAX ,這是其 GPU 加速深度學習框架的最新補充。 JAX 是一個快速增長的高性能數值計算和機器學習研究庫。
JAX 可以自動區分本機 Python 函數并實現類似 NumPy 的 API 。
只需幾行代碼, JAX 就可以跨多節點和多 GPU 系統進行分布式訓練,并通過 NVIDIA GPU 上的 XLA 優化內核加速性能。
使用 JAX 實現的一些研究領域包括變壓器、強化學習、流體動力學、地球物理建模、藥物發現、計算機視覺等。 JAX 的早期采用者包括 DeepMind 、 Google Research 、 eBay 和 InstaDeep 。
NVIDIA 正在與 JAX 團隊合作,以確保 GPU 上的 JAX 用戶獲得最佳性能和改進的體驗。優化的亮點包括:
- 跨多個 GPU 和多個節點的高效擴展
- 使用針對 T5X 和基于 GPT 的模型的優化培訓腳本,簡化培訓 LLM 的工作流程
- 為所有主要云平臺構建
有關詳細信息,請參閱以下資源:
- 立即申請 JAX NGC 容器更新?,今年晚些時候可供私人提前訪問。
- 查看新的 論壇?,了解與 JAX 相關的軟件產品更新、版本和關鍵錯誤修復。
- 加入我們的新 Discord server ,在 NVIDIA GPU 上使用 JAX 在社區內聊天。
將此 GTC 會話添加到日歷中:
PyTorch NVIDIA AI 上的 Geometric 和 DGL
PyTorch Geometric ( PyG )和 Deep Graph Library ( DGL )是最流行的 GNN 框架。 NVIDIA 為 GPU 優化的 GNN 框架 PyG 和 DGL 引入了容器,旨在幫助開發人員、研究人員和數據科學家加速圖形學習,包括 NVIDIA GPU 上具有數十億條邊的大型異構圖形。
使用 NVIDIA AI 加速 GNN 框架,您可以實現端到端性能優化,使其成為預處理和訓練 GNN 的最快解決方案。
此次發布的亮點:
- 用于 GPU 優化 DGL 和 PyTorch Geometric 的現成容器
- 與 CPU 相比, ETL 、采樣和培訓的端到端執行時間減少了 90%
- GraphSage 、 R-GCN 和 SE3 Transformer 的端到端參考示例
Amazon Search 、美國運通( American Express )、恩托斯( Entos )、美團( Meituan )和 Pinterest 已經利用了這項技術的早期版本,并取得了巨大的成果。
美國運通研究部很高興 DGL 能夠通過改進欺詐檢測來幫助改善其持卡人的體驗。
“ OrbNet 在 DGL 和 NVIDIA GPU 的幫助下,實現了對藥物分子特性的準確和數據高效預測,通過鉛識別和鉛優化,將推進新藥候選所需的時間減少了數年。” Tom Miller , Entos 首席執行官
“美團的 GNN 平臺對 DGL 和 GPU 性能進行了優化,為美團提供多種服務,包括搜索、推薦、廣告等。” Mengdi Zhang ,圖學習主管,高級算法專家,美團
開發人員、研究人員和數據科學家可以使用新的容器來加速開發,從而更快地采用 GNN 。
要通過容器化解決方案快速利用 GNN ,請申請盡早訪問 PyG 和 DGL 的 GPU 優化、性能優化和測試容器。
將這些 GTC 會話添加到您的日歷中:
- Accelerating GNNs with PyTorch Geometric and GPUs
- Accelerating GNNs with Deep Graph Library and GPUs
- Accelerate and Scale GNNs with Deep Graph Library and GPUs
- Introduction to Graph Neural Networks
CV-CUDA I NVIDIA 公司
NVIDIA 推出了 CV-CUDA ,這是一個新的開源項目,使開發人員能夠在云級 artificial intelligence (AI) imaging and computer vision (CV) 工作負載中構建高效、 GPU 加速的預處理和后處理管道。
亮點:
- 作為獨立操作程序的 50 多個高性能 CUDA 內核的專門集合
- 批處理支持在一個批中使用可變形狀圖像
有關更多 CV- CUDA 更新,請參閱 CV-CUDA early access interest 頁面。
NVIDIA Triton ?聲波風廓線儀
NVIDIA 宣布了對 NVIDIA Triton 的關鍵更新,該開源推理服務軟件為生產中的每個應用程序帶來了快速、可擴展的 AI 。在過去的 12 個月中,添加了 50 多個功能。
顯著的功能添加:
- 使用 NVIDIA Triton 管理服務進行模型編排,該服務自動部署和管理 Kubernetes 中 Triton 推斷服務器實例上的多個模型。申請 early access 。
- 具有多 GPU 的大型語言模型推理,使用 Faster transformer 后端的多節點執行。
- 使用業務邏輯腳本,使用高級邏輯對管道(集成)進行建模。
- 默認情況下,會自動生成快速部署所需的最低模型配置。
在 NVIDIA LaunchPad 中,無需設置您自己的環境即可立即、短期訪問,開啟您的 NVIDIA Triton 之旅。
您還可以從 NGC catalog 下載 NVIDIA Triton ,訪問代碼和 /triton-inference-server GitHub repo 上的文檔,然后獲取 企業級支持?。
將這些 GTC 會話添加到您的日歷中:
- Take Your AI Inference to the Next Level
- Simplifying Inference for Every Model with Triton and TensorRT
- Accelerating and Scaling Inference with NVIDIA GPUs
- Efficient Cloud-based Deployment of Deep Learning Models using Triton Inference Server and TensorRT
查看快速
在 2022 年 GTC , NVIDIA 宣布,《財富》 100 強公司中有 25% 選擇的數據科學加速解決方案 RAPIDS 正在進一步打破采用和可用性障礙。它使幾乎每個組織都可以訪問加速分析,無論他們使用的是低級 C ++庫、 Windows ( WSL )還是基于云的數據分析平臺。新功能將于 10 月中旬推出。
亮點:
- 對 WSL 和 Arm SBSA 的支持現已普遍提供
- 支持 Windows 為 900 萬使用 Windows 的新 Python 開發人員帶來了 RAPIDS 的便利和力量。
- 在 Kubernetes 和 Kubeflow 上輕松啟動多節點工作流
- 提前估計集群資源以進行交互式工作通常具有極大的挑戰性。現在,您可以方便地從交互式 Jupyter 會話中啟動 Dask RAPIDS 集群,并在容器資源之外突發,以實現 ETL 和 ML 組合工作負載。
有關最新版本的更多信息,請下載并嘗試 NVIDIA RAPIDS 。
將這些 GTC 會話添加到您的日歷中:
- A Deep Dive into RAPIDS for Accelerated Data Science and Data Engineering
- Advances in Accelerated Data Science
NVIDIA RAPIDS Apache Spark 加速器
NVIDIA RAPIDS accelerator for Apache Spark 3.x 的新功能于 2022 年 GTC 發布。新功能帶來了前所未有的透明度,幫助您在 NVIDIA GPU 上加速 Apache Spark DataFrame 和 SQL 操作,無需更改代碼,也無需離開 Apache Spark 環境。版本 22.10 將于 10 月中旬推出。
此版本的新功能進一步促進了加速現有 Apache Spark 工作負載的任務,無論您在哪里運行它們。
亮點:
- 新的工作負載加速工具分析 Apache Spark 工作負載,并建議優化 GPU 參數以節省成本和提高性能。
- 與 Google Cloud DataProc 集成。
- 與三角洲湖和阿帕奇冰山融為一體。
有關最新版本的更多信息,請下載并嘗試 NVIDIA RAPIDS Accelerator for Apache Spark
將這些 GTC 會話添加到您的日歷中:
NVIDIA cuQuantum 和 NVIDIA -QODA
在 2022 年 GTC , NVIDIA 宣布推出最新版本的 NVIDIA cuQuantum SDK ,用于加速量子電路模擬。 cuQuantum 使量子計算生態系統能夠以未來量子優勢的規模解決問題,從而能夠開發算法以及設計和驗證量子硬件。
NVIDIA 還宣布了 NVIDIA QODA 的生態系統更新,這是一個開放的、不受 QPU 限制的混合量子經典計算平臺。這種量子/經典混合編程模型可以與當今最重要的科學計算應用程序進行互操作。我們正在向大量新的領域科學家和研究人員開放量子計算機編程。
cuQuantum 亮點:
- DGX cuQuantum 設備中的多節點、多 GPU 支持
- 支持近似張量網絡方法
- 采用 cuQuantum 的勢頭繼續增強,包括 CSP 和工業量子集團
QODA 私人測試版亮點:
- 單源 C ++和 Python 實現,以及混合系統的編譯器工具鏈和量子算法原語的標準庫
- QPU 不可知,與量子硬件公司在廣泛的量子比特模式上合作
- 與同樣運行在 A100 GPU 上的領先 Pythonic 框架相比,速度提高了 300 倍
將這些 GTC 會話添加到您的日歷中:
- An Introduction to cuQuantum
- Accelerating Quantum Computing Research with GPUs
- Scaling Quantum Circuit Simulations with cuQuantum for Quantum Algorithm
- Quantum Computing Simulation in Pharmaceuticals Research
- Defining the Quantum-Accelerated Supercomputer
- A Deep Dive into the Latest HPC Software
?