高性能計算

2022年 8月 23日
NVIDIA Grace CPU 內部:NVIDIA 為 HPC 和 AI 加強超級芯片工程
NVIDIA Grace CPU 是 NVIDIA 開發的第一個數據中心 CPU 。它是從頭開始建造的,以創建 世界上第一個超級芯片 .
4 MIN READ

2022年 5月 19日
騰訊廣告視頻抽幀的全流程 GPU 加速
騰訊廣告的開發人員改進了視頻抽幀的實現方式,使得全流程的操作均在 GPU 上完成,取代了原有的 CPU 抽幀流程,提高了性能,并降低了成本。
4 MIN READ

2022年 5月 19日
NVIDIA A100 加速醫學圖像處理深度學習研究
本案例中通過 NVIDIA A100 GPU 加速器,上海市磁共振重點實驗室構建了高效的深度學習科研硬件平臺,
1 MIN READ

2022年 1月 27日
多節點多 GPU :大規模使用 NVIDIA cuFFTMp FFT
今天,NVIDIA 宣布發布 Early Access ( EA )的 cuFFTMp 。 cuFFTMp 是 cuFFT 的多節點、
4 MIN READ

2022年 1月 27日
使用最新的 Nsight Compute 進行高級內核評測
NVIDIA Nsight Compute 是用于 CUDA 應用程序的交互式內核分析器。
2 MIN READ

2022年 1月 17日
CUDA 11.6 工具包發布新版本
NVIDIA 發布了 CUDA 開發環境 CUDA 11.6 的最新版本。本版本的重點是增強 CUDA 應用程序的編程模型和性能。
1 MIN READ

2022年 1月 13日
使用 NVIDIA CUDA-Pointpillars 檢測點云中的對象
點云是坐標系中的點數據集。點包含豐富的信息,包括三維坐標(X、Y、Z)、顏色、分類值、強度值和時間等。
2 MIN READ

2022年 1月 12日
用標準語言并行性開發加速代碼
NVIDIA 平臺是最成熟、最完整的加速計算平臺。在這篇文章中,我將介紹最簡單、最高效、最可移植的加速計算方法。有三種編程方法 GPU (圖…
3 MIN READ

2022年 1月 5日
通過 NVIDIA DLI 的入門課程開始學習 NVIDIA Triton
很多人喜歡構建機器學習模型。挑戰包括確定要預測的變量、尋找最佳模型體系結構的實驗,以及對正確的訓練數據進行采樣。但是,如果您無法訪問該模型,
1 MIN READ

2021年 12月 17日
利用高性能虛擬工作站加速地球科學工作流程
無論是遠程工作還是辦公室工作,地球科學家都依賴于快速訪問大型復雜數據集來提高工作效率。然而,他們高達 40% 的時間花在等待數據加載上,
1 MIN READ

2021年 12月 13日
使用 HPC SDK 21.11 (現已提供)最大限度地提高 HPC 應用程序的性能
在超級計算大會 (SC21) 上,NVIDIA 預先宣布了 HPC SDK 的下一次更新。今天,HPC SDK 21.11…
1 MIN READ

2021年 11月 29日
使用 cuTENSOR v1.4 編程分布式多 GPU 張量運算
今天, NVIDIA 宣布推出 cuTENSOR 1.4 版,它支持多達 64 維張量、分布式多 GPU 張量操作,
1 MIN READ

2021年 11月 23日
使用 CUTLASS v2.8 實現高性能矩陣乘法
NVIDIA 繼續增強 Cutslass ,以提供對混合精度計算的廣泛支持,提供專門的數據移動和多重累積抽象。今天,
1 MIN READ

2021年 11月 17日
MLPerf HPC v1.0 :深入研究優化,創造 NVIDIA 創紀錄的性能
在 MLPerf HPC v1 . 0 中, NVIDIA 供電系統贏得了五項新的行業指標中的四項,
2 MIN READ

2021年 11月 17日
以百萬倍的性能克服高級計算難題
上周在 NVIDIA GTC 上,Jensen Huang 在計算性能方面展示了 the vision for realizing…
2 MIN READ

2021年 11月 16日
加速 ReLu 和 GeLu 激活功能,并在 cuSPARSELt v0.2.0 中批量稀疏 GEMM
今天,英偉達宣布推出 cuSPARSELt,版本 0 . 2 . 0 ,它提高了激活函數、偏差向量和批處理稀疏 GEMM 的性能。
2 MIN READ