Best practice

2024年 8月 14日
NVIDIA NIM 微服務助力大規模 LLM 推理效率優化
隨著大型語言模型 (LLMs) 繼續以前所未有的速度發展,企業希望構建生成式 AI 驅動的應用程序,以最大限度地提高吞吐量,降低運營成本,
2 MIN READ

2024年 7月 31日
NVIDIA Nsight Graphics 幫助您輕松調試著色器
著色器是在 GPU 上運行的專用程序,可處理光線、像素、頂點和紋理,以實現獨特的視覺效果。借助著色器,您可以為渲染的圖像添加創意表達和真實感。
2 MIN READ

2024年 7月 24日
利用 OpenUSD 構建產品配置器
從廣告公司到軟件供應商的開發者都在助力全球品牌通過產品配置器解決方案為數字體驗和視覺故事提供超個性化體驗。
1 MIN READ

2024年 7月 9日
構建網絡語言模型以解鎖新的網絡安全功能
通用型大型語言模型 (LLM) 已證明其在各個領域的效用,在文本生成和復雜問題解決等應用中提供了巨大的優勢。但是,在某些情況下,
3 MIN READ

2024年 6月 27日
保護應用程序完整性的安全 LLM 令牌化解決方案
本文是 NVIDIA AI Red Team 持續漏洞和技術研究的一部分。NVIDIA AI Red Team’…
1 MIN READ

2024年 6月 12日
在 cuBLAS 中引入分組 GEMM API 以及更多性能更新
最新版本 NVIDIA cuBLAS 庫版本 12.5 將繼續為深度學習(DL)和高性能計算(HPC)工作負載提供功能和性能。
2 MIN READ

2024年 5月 8日
使用 NVIDIA AI LangChain AI 端點構建 RAG 管道的提示
檢索增強生成(RAG)是一種將信息檢索與一組精心設計的系統提示相結合的技術,旨在從 大型語言模型(LLM)中生成高質量的內容。
3 MIN READ

2024年 4月 29日
NVIDIA GTC 2024 的頂級數據科學會議現已按需提供
在 GTC 2024 上, NVIDIA 的專家和我們的合作伙伴分享了有關 GPU 加速工具、優化和數據科學家最佳實踐的見解。
1 MIN READ

2024年 3月 20日
使用 NVIDIA Holoscan 1.0 開發生產就緒型 AI 傳感器處理應用
邊緣 AI 開發者正在為安全關鍵型和受監管用例構建 AI 應用和產品。借助 NVIDIA Holoscan 1.0,
2 MIN READ

2024年 3月 14日
強大的著色器見解:通過 NVIDIA Nsight Graphics 使用著色器調試信息
隨著光線追蹤成為現代游戲引擎中的主要渲染技術,單個 GPU RayGen 著色器現在可以執行幀的大部分光線模擬。為了管理這種復雜程度,
3 MIN READ

2024年 2月 21日
限制 CPU 線程以獲得更好的游戲性能
許多 PC 游戲都圍繞 8 核游戲機進行設計,并假設其軟件線程系統在所有 PC 上都“正常工作”,尤其是在工作線程池中的線程數量方面。不久前,
1 MIN READ

2024年 1月 23日
借助 NVIDIA Quantum InfiniBand 簡化 AI 網絡運營
一個常見的技術誤區是,性能和復雜性直接相關。也就是說,高性能的實現也是實現和管理最具挑戰性的。但是,在考慮數據中心網絡時,情況并非如此。
1 MIN READ

2024年 1月 5日
在某些場景中使用 cgroup 縮短 CUDA 初始化時間
在多 GPU 平臺上運行的許多 CUDA 應用程序通常使用單個 GPU 來滿足其計算需求。在這種情況下,應用程序會支付性能損失,
2 MIN READ

2023年 12月 15日
高級 API 性能:交換鏈
交換鏈是如何將渲染數據輸出到屏幕的不可或缺的一部分。它們通常由一組輸出就緒型緩沖區組成,每個緩沖區都可以旋轉渲染為一個緩沖區。
1 MIN READ

2023年 11月 21日
高級 API 性能:內部函數
Intrinsics 可被視為特定硬件指令的更高級別的抽象。它們提供對低級操作或特定于硬件的功能的直接訪問,從而提高性能。這樣,
1 MIN READ

2023年 11月 15日
使用 NVIDIA IGX Orin 開發者套件在邊緣部署大型語言模型
隨著 大型語言模型 (LLM) 功能變得更加強大,降低計算需求的技術也日趨成熟,因此出現了兩個令人關注的問題。首先,
2 MIN READ