Posts by Dave Salvator
AI 平臺/部署
2025年 3月 19日
AI 推理時代的 NVIDIA Blackwell Ultra
多年來,AI 的進步一直通過預訓練擴展遵循清晰的軌跡:更大的模型、更多的數據和更豐富的計算資源帶來了突破性的功能。在過去 5 年中,
2 MIN READ
數據中心/云端
2023年 12月 13日
借助 NVIDIA H100 Tensor Core GPU 和 NVIDIA TensorRT-LLM 實現出色的推理性能
出色的 AI 性能需要高效的并行計算架構、高效的工具堆棧和深度優化的算法。NVIDIA 發布了 NVIDIA TensorRT-LLM,
2 MIN READ
數據中心/云端
2023年 12月 4日
新的 NVIDIA NeMo 框架功能和 NVIDIA H200 強效助力 LLM 訓練性能和通用性
AI 在規模、復雜性和多樣性方面的快速增長推動了對 大型語言模型 (LLM) 訓練性能的不斷需求。要提供出色的性能,
3 MIN READ
網絡
2023年 7月 6日
新的 MLPerf 推理網絡部門展示 NVIDIA InfiniBand 和 GPUDirect RDMA 功能
在 MLPerf Inference v3.0 中,NVIDIA 首次向新推出的 網絡分割 投入,
3 MIN READ
模擬/建模/設計
2022年 4月 6日
在 MLPerf 推理 2.0 上獲得最佳性能
Megatron 530B 等機型正在擴大人工智能可以解決的問題范圍。然而,隨著模型的復雜性不斷增加,它們對人工智能計算平臺構成了雙重挑戰:
4 MIN READ
圖形/仿真
2021年 11月 29日
AWS 推出首款基于 NVIDIA GPU 加速引力子的 Amazon EC2 G5g 實例
今天,在 AWS re : Invent2021 大會上, AWS 宣布 推出了 Amazon EC2 G5g 實例,
1 MIN READ