Matthew Nicely

Matthew Nicely 于 2019 年 3 月加入 NVIDIA ,之前曾在美國 AL-Huntsville 的美國陸軍航空和導彈研究開發與工程中心工作。在那里,他專注于 CUDA 算法開發和 Jetson 系列的優化。在 NVIDIA ,他曾在聯邦部門工作,協助 CUDA 的開發和優化,以及在各種 NVIDIA 工具集上為客戶提供教育和概念驗證,最近轉為 math libraries 產品經理。 2019 年,他獲得了博士學位。計算機工程學位,專注于 GPU 的算法優化。

Posts by Matthew Nicely

對話式人工智能

使用 NVIDIA cuDNN 9 加速多個 Transformer

我們提供的 NVIDIA CUDA 深度神經網絡庫(cuDNN) 是一個專門為深度學習應用而設計的 GPU 加速庫, 4 MIN READ
模擬/建模/設計

CUDA 工具包 12.0 正式發布

NVIDIA 宣布最新的 CUDA 工具包軟件版本 12.0 。該版本是多年來的第一個主要版本, 4 MIN READ
高性能計算

使用 cuTENSOR v1.4 編程分布式多 GPU 張量運算

今天, NVIDIA 宣布推出 cuTENSOR 1.4 版,它支持多達 64 維張量、分布式多 GPU 張量操作, 1 MIN READ
高性能計算

使用 CUTLASS v2.8 實現高性能矩陣乘法

NVIDIA 繼續增強 Cutslass ,以提供對混合精度計算的廣泛支持,提供專門的數據移動和多重累積抽象。今天, 1 MIN READ
高性能計算

加速 ReLu 和 GeLu 激活功能,并在 cuSPARSELt v0.2.0 中批量稀疏 GEMM

今天,英偉達宣布推出 cuSPARSELt,版本 0 . 2 . 0 ,它提高了激活函數、偏差向量和批處理稀疏 GEMM 的性能。 2 MIN READ
高性能計算

在 nvCOMP v2.1.0 中使用完全重新設計的批處理 API 和性能優化

今天, NVIDIA 宣布推出 nvCOMP 2 . 1 . 0 版。現在可以免費下載此軟件。 立即下載 有關更多信息, 1 MIN READ