Shobhit Verma

Shobhit Verma 是 NVIDIA TensorRT 團隊的軟件工程師,專注于 MLPerf Inference.他在設計和驗證 ML 加速器、開發高性能計算應用程序和分布式系統方面擁有豐富經驗。Shobhit 擁有芝加哥大學計算機科學碩士學位和德里理工大學計算機工程學士學位

Posts by Shobhit Verma

生成式人工智能/大語言模型

NVIDIA Triton 推理服務器在 MLPerf Inference 4.1 基準測試中實現出色性能

六年前,我們踏上了開發 AI 推理服務解決方案的旅程,該解決方案專為高吞吐量和時間敏感型生產用例而設計。當時,ML 開發者正在部署定制的、 2 MIN READ