Xavier Simmons

Xavier Simmons 是 NVIDIA 的高級開發者技術工程師,熱衷于突破深度學習性能的極限。他專注于在計算受限和 IO 受限工作負載的交叉路口進行推理和訓練優化。加入 NVIDIA 之前,他從事彈性 GPU 加速存儲解決方案的研究。Xavier 擁有懷卡托大學計算機科學學士學位。

Posts by Xavier Simmons

數據中心/云端

NVIDIA Blackwell 在 MLPerf Inference v5.0 中實現巨大的性能飛躍

在不斷增長的模型大小、實時延遲要求以及最近的 AI 推理的推動下, 大語言模型 (LLM) 推理的計算需求正在快速增長。與此同時, 3 MIN READ