薛博陽

2019 年加入 NVIDIA DevTech 團隊,專注于語言模型的技術開發與優化。目前主要負責 TensorRT-LLM 的功能開發。

Posts by 薛博陽

加速計算

NVIDIA GPU 架構下的 FP8 訓練與推理

本文聚焦 NVIDIA FP8 訓練與推理的實踐應用,該內容來源于 2023 云棲大會 NVIDIA 專場演講。 FP8 訓練利用 E5M2/ 5 MIN READ
生成式人工智能/大語言模型

FP8:前沿精度與性能的新篇章

在深度學習和人工智能的快速發展背景下,尤其是大語言模型(Large Language Model, LLM)的蓬勃發展, 3 MIN READ
計算機視覺/視頻分析

全棧創新為 NVIDIA 最高 MLPerf 推斷 2.1 結果提供燃料

如今,人工智能驅動的應用程序正在實現更豐富的體驗,這是由更大和更復雜的人工智能模型以及許多模型在管道中的應用所推動的。 4 MIN READ
對話式人工智能/自然語言處理

使用 FasterTransformer 和 Triton 推理服務器加速大型?Transformer?模型的推理

這是討論 NVIDIA FasterTransformer 庫的兩部分系列的第一部分, 3 MIN READ
對話式人工智能/自然語言處理

使用 FasterTransformer 和 Triton 推理服務器部署 GPT-J 和 T5

這是關于 NVIDIA 工具的兩部分系列的第二部分,這些工具允許您運行大型Transformer模型以加速推理。 5 MIN READ