高性能計算

2022年 8月 23日

NVIDIA Grace CPU 內部：NVIDIA 為 HPC 和 AI 加強超級芯片工程

NVIDIA Grace CPU 是 NVIDIA 開發的第一個數據中心 CPU 。它是從頭開始建造的，以創建世界上第一個超級芯片 .

4 MIN READ

2022年 5月 19日

騰訊廣告視頻抽幀的全流程 GPU 加速

騰訊廣告的開發人員改進了視頻抽幀的實現方式，使得全流程的操作均在 GPU 上完成，取代了原有的 CPU 抽幀流程，提高了性能，并降低了成本。

4 MIN READ

2022年 5月 19日

NVIDIA A100 加速醫學圖像處理深度學習研究

本案例中通過 NVIDIA A100 GPU 加速器，上海市磁共振重點實驗室構建了高效的深度學習科研硬件平臺，

1 MIN READ

2022年 1月 27日

多節點多 GPU ：大規模使用 NVIDIA cuFFTMp FFT

今天，NVIDIA 宣布發布 Early Access （ EA ）的 cuFFTMp 。 cuFFTMp 是 cuFFT 的多節點、

4 MIN READ

2022年 1月 27日

使用最新的 Nsight Compute 進行高級內核評測

NVIDIA Nsight Compute 是用于 CUDA 應用程序的交互式內核分析器。

2 MIN READ

2022年 1月 17日

CUDA 11.6 工具包發布新版本

NVIDIA 發布了 CUDA 開發環境 CUDA 11.6 的最新版本。本版本的重點是增強 CUDA 應用程序的編程模型和性能。

1 MIN READ

2022年 1月 13日

使用 NVIDIA CUDA-Pointpillars 檢測點云中的對象

點云是坐標系中的點數據集。點包含豐富的信息，包括三維坐標（X、Y、Z）、顏色、分類值、強度值和時間等。

2 MIN READ

2022年 1月 12日

用標準語言并行性開發加速代碼

NVIDIA 平臺是最成熟、最完整的加速計算平臺。在這篇文章中，我將介紹最簡單、最高效、最可移植的加速計算方法。有三種編程方法 GPU （圖…

3 MIN READ

2022年 1月 5日

通過 NVIDIA DLI 的入門課程開始學習 NVIDIA Triton

很多人喜歡構建機器學習模型。挑戰包括確定要預測的變量、尋找最佳模型體系結構的實驗，以及對正確的訓練數據進行采樣。但是，如果您無法訪問該模型，

1 MIN READ

2021年 12月 17日

利用高性能虛擬工作站加速地球科學工作流程

無論是遠程工作還是辦公室工作，地球科學家都依賴于快速訪問大型復雜數據集來提高工作效率。然而，他們高達 40% 的時間花在等待數據加載上，

1 MIN READ

2021年 12月 13日

使用 HPC SDK 21.11 （現已提供）最大限度地提高 HPC 應用程序的性能

在超級計算大會 (SC21) 上，NVIDIA 預先宣布了 HPC SDK 的下一次更新。今天，HPC SDK 21.11…

1 MIN READ

2021年 11月 29日

使用 cuTENSOR v1.4 編程分布式多 GPU 張量運算

今天， NVIDIA 宣布推出 cuTENSOR 1.4 版，它支持多達 64 維張量、分布式多 GPU 張量操作，

1 MIN READ

2021年 11月 23日

使用 CUTLASS v2.8 實現高性能矩陣乘法

NVIDIA 繼續增強 Cutslass ，以提供對混合精度計算的廣泛支持，提供專門的數據移動和多重累積抽象。今天，

1 MIN READ

2021年 11月 17日

MLPerf HPC v1.0 ：深入研究優化，創造 NVIDIA 創紀錄的性能

在 MLPerf HPC v1 . 0 中， NVIDIA 供電系統贏得了五項新的行業指標中的四項，

2 MIN READ

2021年 11月 17日

以百萬倍的性能克服高級計算難題

上周在 NVIDIA GTC 上，Jensen Huang 在計算性能方面展示了 the vision for realizing…

2 MIN READ

2021年 11月 16日

加速 ReLu 和 GeLu 激活功能，并在 cuSPARSELt v0.2.0 中批量稀疏 GEMM

今天，英偉達宣布推出 cuSPARSELt，版本 0 . 2 . 0 ，它提高了激活函數、偏差向量和批處理稀疏 GEMM 的性能。

2 MIN READ