Author:

3 月 19 日下午 2 點，鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看

郝尚榮

郝尚榮，NVIDIA 深度學習解決方案架構師 2021 年加入 NVIDIA 解決方案架構團隊，主要從事模型推理優化加速的工作，目前主要支持國內 CSP 客戶在大語言模型推理加速的工作。

加速計算 2024年 11月 20日

本文將分享 TensorRT-LLM 中低精度量化內容，并從精度和速度角度對比 FP8 與 INT8。首先介紹性能，包括速度和精度。其次， 5 MIN READ

生成式人工智能/大語言模型 2024年 6月 13日

隨著 ChatGPT 的一夜爆火，大模型如今越來越廣泛的應用到各種業務領域中，阿里安全的業務領域對大模型技術的應用也已經 2 年有余。 4 MIN READ