Michael Yh Wang – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Tue, 29 Oct 2024 04:56:24 +0000
zh-CN
hourly
1
196178272 -
使用 Numbast 實現 CUDA C++ 生態系統與 Python 開發者之間的無縫連接
http://www.open-lab.net/zh-cn/blog/bridging-the-cuda-c-ecosystem-and-python-developers-with-numbast/
Thu, 24 Oct 2024 04:51:36 +0000
http://www.open-lab.net/zh-cn/blog/?p=11681
Continued]]>
通過支持使用 Python 編寫 CUDA 內核函數,類似于在 C++中實現內核函數的方式,Numba 彌合了 Python 生態系統與 CUDA 性能之間的差距。 但是,CUDA C++開發者可以訪問許多目前未在 Python 中公開的庫,包括 CUDA 核心計算庫(CCCL)、cuRAND 以及頭文件實現的數字類型,例如 bfloat16 等。 雖然每個 CUDA C++ 庫都可以用自己的方式介紹給 Python,但是手動為每個庫進行綁定是一項費力、重復的工作,并且容易出現不一致。例如,float16 和 bfloat16 數據類型定義了 60 多個類似的獨立函數,這兩種類型都需要多次類似的綁定。 此外,當底層 CUDA C++庫引入新功能時,手動創建的綁定通常會不同步。 Numba 建立自動化工作流,將 CUDA C/C++API 轉換為 Numba 綁定。
Source
]]>
11681
-
使用 PyOptiX 的 Nuba 擴展在 Python 中編寫光線跟蹤應用程序
http://www.open-lab.net/zh-cn/blog/writing-ray-tracing-apps-in-python-using-numba-for-pyoptix/
Wed, 01 Jun 2022 03:27:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=4254
Continued]]>
光線跟蹤是一種渲染算法,它可以通過模擬光如何傳輸以及與不同材質的交互來生成照片級真實感圖像。如今,它被廣泛應用于游戲開發、電影制作和物理模擬中,將圖像帶入生活。 然而,光線跟蹤算法計算量大,需要在 GPU 上進行硬件加速才能實現實時性能。 為了利用光線跟蹤的硬件功能,人們發明了各種工具鏈和語言來滿足需要,例如 openGL 和著色語言。 通常,這些軟件工具鏈的構建過程會給 Python 開發人員帶來重大挑戰。為了減輕困難并為編寫光線跟蹤內核提供熟悉的環境, NVIDIA 為 PyOptiX 開發了 Numba 擴展。這種擴展使圖形研究人員和應用程序開發人員能夠減少從構思到實現的時間,并縮短每次迭代的開發周期。 在本文中,我將概述 NVIDIA 光線跟蹤引擎 PyOptiX ,并解釋 Python JIT 編譯器 Numba 如何加速 Python 代碼。最后,
Source
]]>
4254
人人超碰97caoporen国产