Posts by Mike Murphy
生成式人工智能/大語言模型
2024年 6月 18日
使用 NVIDIA CUDA Toolkit 12.4 編譯器創建運行時 Fatbin
CUDA Toolkit 12.4 引入了一個新的 nvFatbin 庫,用于在運行時創建 fatbins。fatbins,
4 MIN READ
模擬/建模/設計
2023年 1月 17日
CUDA 12.0 編譯器使用 nvJitLink 庫支持運行時 LTO
CUDA Toolkit 12.0 引入了一個新的 nvJitLink 庫,用于實時鏈接時間優化( JIT LTO )支持。
5 MIN READ
高性能計算
2021年 10月 25日
使用 CUDA C ++編譯輔助工具減少應用程序構建時間
CUDA 11 . 5 C ++編譯器解決了不斷增長的客戶請求。具體來說,如何減少 CUDA 應用程序構建時間。除了消除未使用的內核外,
4 MIN READ
人工智能/深度學習
2021年 2月 12日
利用 NVIDIA CUDA 11 . 2 設備鏈路時間優化提高 GPU 應用性能
CUDA 11 . 2 的特點是在 GPU 加速應用程序中為設備代碼提供強大的鏈路時間優化( LTO )功能。
3 MIN READ
人工智能/深度學習
2021年 2月 12日
用 NVIDIA CUDA 11 . 2 C ++編譯器提高生產率和性能
11 . 2 CUDA C ++編譯器結合了旨在提高開發者生產力和 GPU 加速應用性能的特性和增強。 編譯器工具鏈將 LLVM 升級到 7…
6 MIN READ