CUDA 圖 – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Wed, 19 Mar 2025 08:42:45 +0000
zh-CN
hourly
1
196178272 -
CUDA 工具包現已支持 NVIDIA Blackwell 架構
http://www.open-lab.net/zh-cn/blog/cuda-toolkit-12-8-delivers-nvidia-blackwell-support/
Fri, 31 Jan 2025 04:55:11 +0000
http://www.open-lab.net/zh-cn/blog/?p=12892
Continued]]>
CUDA 工具包 的最新版本 (版本 12.8) 使用最新的 NVIDIA CPU 和 GPU,持續提升數據科學、AI、科學計算以及計算機圖形和模擬領域的加速計算性能。本文重點介紹了此版本包含的一些新功能和增強功能: CUDA 工具包 12.8 是該工具包的第一個版本,在整個開發者工具套件 (包括性能工具和分析器、庫和編譯器) 中支持 NVIDIA Blackwell 架構。Blackwell 由 208 億個晶體管構建而成,是 NVIDIA Hopper GPU 中晶體管數量的 2.5 倍以上,是迄今為止最大的 GPU。 Blackwell 支持的主要功能包括:Key Blackwell 如需詳細了解 NVIDIA Blackwell 的領先創新,請參閱 NVIDIA Blackwell 架構技術概覽。 借助 Blackwell,
Source
]]>
12892
-
利用 CUDA 圖形、Coroutines 和 GPU 工作流程加速藥物發現進程
http://www.open-lab.net/zh-cn/blog/optimizing-drug-discovery-with-cuda-graphs-coroutines-and-gpu-workflows/
Wed, 23 Oct 2024 05:28:03 +0000
http://www.open-lab.net/zh-cn/blog/?p=11700
Continued]]>
藥物研究需要快速、高效的模擬來預測分子如何相互作用,從而加速藥物研發。NVIDIA 高級開發者技術工程師 Jiqun Tu 和 Schrödinger Desmond 引擎技術負責人 Ellery Russell 將探索旨在加速分子動力學模擬的高級 GPU 優化技術。 在這場 NVIDIA GTC 2024 會議中,他們提出了提高工作負載效率和吞吐量的實用策略,為藥物研究人員提供了增強計算藥物研發的工具。這些策略基于現有的 CUDA 工作流,涵蓋了 CUDA Graphs、C++ coroutines 和 mapped memory 等創新技術,可克服擴展挑戰和瓶頸。 請關注我們,并獲取 會議的 PDF 文件 ,該文件為與會者提供切實可行的技術,以優化性能、最大限度地降低延遲,并充分利用 GPU 功能進行分子模擬。主題包括: CUDA 圖形:
Source
]]>
11700
-
在 NVIDIA RTX 系統上使用 Llama.cpp 加速 LLM
http://www.open-lab.net/zh-cn/blog/accelerating-llms-with-llama-cpp-on-nvidia-rtx-systems/
Wed, 02 Oct 2024 08:42:38 +0000
http://www.open-lab.net/zh-cn/blog/?p=11480
Continued]]>
適用于 Windows PC 平臺的 NVIDIA RTX AI 提供了一個由數千個開源模型組成的蓬勃發展的生態系統,供應用程序開發者利用并集成到 Windows 應用程序中。值得注意的是,llama.cpp 是一款熱門工具,在撰寫本文時擁有超過 65K 顆 GitHub 星。此開源庫最初發布于 2023 年,是一個輕量級、高效的 大語言模型 (LLM) 推理框架,可在包括 RTX PC 在內的一系列硬件平臺上運行。 本文介紹了 RTX PC 上的 Llama.cpp 如何為構建需要 LLM 功能的跨平臺或 Windows 原生應用提供出色的解決方案。 雖然 LLMs 在解鎖令人興奮的新用例方面大有可為,但其大容量內存和計算密集型特性通常使開發者難以將它們部署到生產應用中。為解決這一問題,Llama.cpp 提供了大量功能,以優化模型性能,并在各種硬件上高效部署。
Source
]]>
11480
-
使用 CUDA 圖形優化 Llama.cpp AI 推理
http://www.open-lab.net/zh-cn/blog/optimizing-llama-cpp-ai-inference-with-cuda-graphs/
Wed, 07 Aug 2024 02:40:50 +0000
http://www.open-lab.net/zh-cn/blog/?p=10897
Continued]]>
開源 llama.cpp 代碼庫最初于 2023 年發布,是一種輕量級但高效的框架,用于在 Meta Llama 模型上執行推理。llama.cpp 基于去年發布的 GGML 庫構建,由于專注于 C/C++ 而無需復雜的依賴項,因此很快就吸引了許多用戶和開發者(尤其是在個人工作站上使用)。 自首次發布以來,Llama.cpp 已得到擴展,不僅支持各種模型、量化等,還支持多個后端,包括支持 NVIDIA CUDA 的 GPU。在撰寫本文之時,Llama.cpp 在所有 GitHub 庫中排名第 123 位,在所有 C++ GitHub 庫中排名第 11 位。 在 NVIDIA GPU 上使用 Llama.cpp 執行 AI 推理已經帶來了顯著的優勢,因為它們能夠以極高的性能和能效執行基礎 AI 推理的計算,同時在消費設備和數據中心中也很普遍。NVIDIA 和 Llama.
Source
]]>
10897
-
使用 QUELO-G 和 CUDA 圖進行量子力學增強型藥物研發
http://www.open-lab.net/zh-cn/blog/quantum-mechanics-enhanced-drug-discovery-using-quelo-g-and-cuda-graphs/
Tue, 21 May 2024 04:51:22 +0000
http://www.open-lab.net/zh-cn/blog/?p=10099
Continued]]>
在藥物研發中,人們經常使用基于所謂經典力場的方法,并認為這些方法很有用。然而,人們也廣泛認識到,力場模型中缺少一些重要的物理特性,導致應用受限。 例如,在比較兩種具有不同形式電荷的分子時,力場模型無法提供準確的預測,因為模型中未考慮蛋白質極化。此外,由于缺乏形成和打破化學鍵的能力,這些模型不適用于共價藥物分子。 許多人一致認為,基于量子力學 (管理微觀世界的基本物理學) 的模擬是解決這些問題的方法,但量子力學模擬被認為過于昂貴和耗時,不實用。 QSimulate 近期宣布推出 QUELO-G 平臺,該平臺能夠實現基于量子力學的自由能微擾(FEP)模擬,并實現出色的吞吐量。每個 GPU 卡每天的吞吐量超過 100 納秒,因此這些模擬可以在幾小時內完成。基于量子力學的模擬的直接應用將改變計算機輔助藥物研發,特別是在識別新的藥物分子方面。
Source
]]>
10099
人人超碰97caoporen国产