Posts by Matthew Nicely
對話式人工智能
2024年 5月 24日
使用 NVIDIA cuDNN 9 加速多個 Transformer
我們提供的 NVIDIA CUDA 深度神經網絡庫(cuDNN) 是一個專門為深度學習應用而設計的 GPU 加速庫,
4 MIN READ
模擬/建模/設計
2022年 12月 12日
CUDA 工具包 12.0 正式發布
NVIDIA 宣布最新的 CUDA 工具包軟件版本 12.0 。該版本是多年來的第一個主要版本,
4 MIN READ
高性能計算
2021年 11月 29日
使用 cuTENSOR v1.4 編程分布式多 GPU 張量運算
今天, NVIDIA 宣布推出 cuTENSOR 1.4 版,它支持多達 64 維張量、分布式多 GPU 張量操作,
1 MIN READ
高性能計算
2021年 11月 23日
使用 CUTLASS v2.8 實現高性能矩陣乘法
NVIDIA 繼續增強 Cutslass ,以提供對混合精度計算的廣泛支持,提供專門的數據移動和多重累積抽象。今天,
1 MIN READ
高性能計算
2021年 11月 16日
加速 ReLu 和 GeLu 激活功能,并在 cuSPARSELt v0.2.0 中批量稀疏 GEMM
今天,英偉達宣布推出 cuSPARSELt,版本 0 . 2 . 0 ,它提高了激活函數、偏差向量和批處理稀疏 GEMM 的性能。
2 MIN READ
高性能計算
2021年 11月 15日
在 nvCOMP v2.1.0 中使用完全重新設計的批處理 API 和性能優化
今天, NVIDIA 宣布推出 nvCOMP 2 . 1 . 0 版。現在可以免費下載此軟件。 立即下載 有關更多信息,
1 MIN READ