Development & Optimization

2025年 3月 10日
優化 CUDA C++ 編譯時間
在現代軟件開發中,時間是非常寶貴的資源,尤其是在編譯過程中。對于在大規模 GPU 加速應用程序上使用 CUDA C++的開發者而言,
2 MIN READ

2025年 2月 25日
NVIDIA cuDSS 提高工程和科學計算中的求解器技術
NVIDIA cuDSS 是第一代稀疏直接求解器庫,旨在加速工程和科學計算。cuDSS 正越來越多地應用于數據中心和其他環境,
4 MIN READ

2025年 2月 20日
制造業產品設計工作流程的生成式 AI 轉型
長期以來,制造行業的傳統設計和工程工作流程一直以順序迭代的方法為特征,這種方法通常既耗時又需要大量資源。這些傳統方法通常涉及需求收集、
2 MIN READ

2025年 2月 13日
使用 DeepSeek-R1 和推理時間縮放實現自動化 GPU 內核生成
隨著 AI 模型擴展其功能以解決更復雜的挑戰,一種稱為“ 測試時擴展 ”或“ 推理時擴展 ”的新擴展法則正在出現。
2 MIN READ

2025年 1月 15日
提升 AI 性能的 GPU 內存基礎知識
生成式 AI 徹底改變了人們將想法變為現實的方式,而代理 AI 代表著這一技術變革的下一次飛躍。通過利用復雜的自主推理和迭代規劃,
2 MIN READ

2024年 12月 17日
NVIDIA OptiX 著色器綁定表優化實現高效光線追蹤
NVIDIA OptiX 是通過 CUDA 實現 GPU 加速光線追蹤的 API,通常用于渲染包含各種物體和材質的場景。
2 MIN READ

2024年 12月 16日
2024 年熱門文章:NVIDIA NIM、語言模型突破和數據科學優化的精要
對于使用 NVIDIA 技術的開發者、研究人員和創新者來說,2024 年又是具有里程碑意義的一年。
2 MIN READ

2024年 11月 20日
使用 EMBark 加速大規模推薦系統嵌入式訓練優化
推薦系統是互聯網行業的核心,而高效地訓練這些系統對于各大公司來說是一個關鍵問題。大多數推薦系統是深度學習推薦模型(DLRMs),
2 MIN READ

2024年 10月 31日
深度學習 AI 模型無需手術即可檢測乳腺癌擴散
在診斷癌細胞是否擴散(包括擴散到附近的淋巴結)時, 新的深度學習模型 可以減少對手術的需求(也稱為轉移)。
1 MIN READ