• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 生成式人工智能/大語言模型

    為 NVIDIA Blackwell GeForce RTX 50 系列 GPU 發布全新 AI SDK 和工具

    NVIDIA 最近宣布推出 新一代 PC GPU – GeForce RTX 50 系列 ,以及面向開發者的全新 AI 賦能 SDK 和工具。GeForce RTX 50 系列由 NVIDIA Blackwell 架構 、第五代 Tensor Cores 和第四代 RT Cores 提供動力支持,在神經著色器、數字人技術、幾何圖形和照明等 AI 驅動渲染方面實現了突破。

    今天,NVIDIA 發布了第一波適用于 GeForce RTX 50 Series GPUs 的 SDK。作為開發者,您可以開始將這些更新集成到您的應用中,以確保與 NVIDIA Blackwell RTX GPUs 的軟件兼容性和最佳性能,并展示 GeForce RTX 50 Series GPUs 的新功能。

    本文詳細介紹了新的和更新的 SDK,這些 SDK 可助力開發者充分利用 NVIDIA Blackwell GeForce RTX 50 系列 GPUs。

    改進的 AI 框架:CUDA、TensorRT 和 PyTorch

    為確保與 GeForce RTX 50 系列兼容,建議開發者更新到最新版 AI 框架。

    • CUDA 工具包 12.8 NVIDIA TensorRT 10.8 現已推出,可優化 RTX 50 系列 GPU 的 AI 性能。
    • NVIDIA Blackwell RTX GPU 上適用于原生 Windows 的 PyTorch 更新已上傳到 PyTorch GitHub 主庫。適用于 Windows 的 PyPi 二進制文件和軟件包將很快更新。
    • NVIDIA Blackwell RTX GPU 上的 PyTorch for Linux x86_64 現在可在 每日版 本中使用。

    有關將應用程序更新到最新 AI 框架的詳細信息,請參閱適用于 NVIDIA Blackwell RTX GPU 的 軟件遷移指南:CUDA 12.8、PyTorch、TensorRT 和 Llama.cpp 指南。

    TensorRT 10.8 引入了對 FP4 的支持,與 RTX 4090 上的 FP16 精度相比,FP4 可將基于擴散的最新模型 (如 Flux) 的性能提升 2 倍以上。此外,TensorRT 10.8 還提供了 weight-stripped engines,以防止在為不同的 GPU arch 系列提供專用引擎時出現權重重復,從而提高內存利用率。此外, NVIDIA TensorRT-Cloud 現在支持最新的 GeForce RTX 50 Series GPUs,使開發者能夠遠程構建優化的推理引擎。

    AI 驅動的游戲?

    GeForce RTX 50 系列 GPUs 和最新的 SDK 更新讓開發者能夠使用以下技術打造革命性游戲。

    使用 NVIDIA DLSS 進行神經網絡渲染

    NVIDIA DLSS 是一套神經渲染技術,可利用 AI 提升 FPS、降低延遲并提高畫質。 DLSS 4 由 GeForce RTX 50 系列 GPUs 和第五代 Tensor Cores 提供動力支持,引入了 DLSS 多幀生成技術,可額外生成多達三個幀,并與全套 DLSS 技術協同工作,相較于傳統的強力渲染,幀率可提升高達 8 倍。此外,DLSS 光線重建、DLSS 超分辨率和 DLAA 技術現在由基于 Transformer 的模型提供支持,可改善所有 GeForce RTX GPUs 的圖像和照明細節以及穩定性。

    通過 NVIDIA Streamline 開始使用 DLSS。NVIDIA Streamline 是一種開源的交叉 IHV 解決方案,可簡化將最新的 NVIDIA 和其他超分辨率技術集成到應用和游戲中的過程。

    借助 NVIDIA ACE 讓游戲角色如生

    NVIDIA ACE 是一套數字人技術,可借助生成式 AI 讓游戲角色和數字助理如生。現在,ACE 可讓您在游戲或應用中為數字人輕松添加代理功能。它包括以下內容:

    • 搶先體驗版新的多模態 SLMs,適用于高級和自主代理工作流,并支持更長的上下文和復雜的推理任務。
    • Audio2Face 3D NIM 使用實時音頻提供先進的唇同步和面部動畫。

    借助 NVIDIA In-Game Inferencing SDK 簡化 AI 模型部署

    NVIDIA 游戲內推理 (IGI) SDK 可簡化 PC 游戲開發者的 AI 模型部署和集成。SDK 預配置 PC 所需的 AI 模型、引擎和依賴項。它為 C++ 游戲編排進程內 AI 推理,并跨不同硬件加速器 (GPU、NPU、CPU) 支持所有主要推理后端。IGI SDK 現已為部分合作伙伴提供 beta 測試版,即將全面推出。

    加速內容創作?

    支持在 Blackwell RTX GPU 上創建內容的全新和更新 SDK 包括以下內容。

    使用 NVIDIA Maxine 增強視頻會議效果

    NVIDIA Maxine 是一系列高性能、易于使用的 NVIDIA NIM 微服務和 SDK 的集合,用于部署 AI 功能,以增強音頻、視頻和增強現實效果,從而實現視頻會議和遠程呈現。新功能包括:

    • Studio Voice 可以使任何麥克風發出專業的聲音。
    • “Virtual Key Light” 可將面部重塑為使用虛擬按鍵光的效果 (即將推出)。

    使用 NVIDIA Iray 生成逼真的圖像

    NVIDIA Iray SDK 是一種基于物理性質的直觀渲染技術,可為交互式批量渲染工作流程生成逼真的圖像。更新包括:

    • 使用新的 NVIDIA MDL SDK 1.10 改進了漫反射和光澤 BRDF
    • 改進了幾何圖形的鑲嵌和位移
    • 焦散的精確可靠渲染
    • 新模式可自動啟用和禁用焦散采樣,從而提高渲染質量或性能
    • 支持更快的集群或網絡渲染

    使用 NVIDIA Video Codec SDK 進行硬件加速的視頻編碼和解碼

    NVIDIA 視頻編解碼器 SDK 是一組 API,用于在 Windows 和 Linux 上執行硬件加速的視頻編碼和解碼。更新包括:

    • 支持 4:2:2 H.264、HEVC 編碼和解碼,以利用 Blackwell 中的第九代 NVENC 編碼
    • 推出 MV-HEVC 和 UHQ AV1,以提高編碼質量
    • 與前幾代產品相比,每個 NVDEC 的顯存解碼優化和 2xH.264 解碼吞吐量為 2 倍

    這些更新即將通過 FFMPEG、Microsoft DXVA 和 MFT 框架使用。

    使用 NVIDIA OptiX 優化光線追蹤

    NVIDIA OptiX SDK 是一個應用框架,用于在 GPU 上實現出色的光線追蹤性能。它提供了一個簡單、遞歸且靈活的工作流,用于加速光線追蹤算法。OptiX 9.0 的更新包括:

    • 集群 API,可加速大規模動態三角形網格的 BVH 構建
    • 協作向量 API,用于在由 NVIDIA Tensor Core 加速的 OptiX 著色器程序中執行小型 AI 網絡
    • Blackwell GPU 上的硬件加速線性曲線

    借助 NVIDIA RTX Video SDK 提升 AI 增強效果

    NVIDIA RTX Video SDK 為創意和媒體播放應用提供 AI 增強效果技術,以提高清晰度和清晰度,并將 SDR 視頻自動轉換為 HDR。這些更新帶來了新的神經網絡,其性能提高了 40%,將 AI 放大應用于 10 位 HDR 視頻,并支持 CUDA。

    開始使用?

    準備好在全球超過 1 億臺 RTX PC 上試驗、開發和優化新的 AI 功能了嗎?在 NVIDIA RTX PC 上開始使用 AI。如需詳細了解如何在 AI 應用中添加對 NVIDIA Blackwell RTX GPU 的支持以實現更高性能,請查看《Software Migration Guide for NVIDIA Blackwell RTX GPUs:CUDA 12.8、PyTorch、TensorRT 和 Llama.cpp 指南》。

    0

    標簽

    人人超碰97caoporen国产