Author:

3 月 19 日下午 2 點，鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看

薛博陽

2019 年加入 NVIDIA DevTech 團隊，專注于語言模型的技術開發與優化。目前主要負責 TensorRT-LLM 的功能開發。

加速計算 2024年 4月 25日

本文聚焦 NVIDIA FP8 訓練與推理的實踐應用，該內容來源于 2023 云棲大會 NVIDIA 專場演講。 FP8 訓練利用 E5M2/ 5 MIN READ

生成式人工智能/大語言模型 2024年 3月 19日

在深度學習和人工智能的快速發展背景下，尤其是大語言模型（Large Language Model, LLM）的蓬勃發展， 3 MIN READ

計算機視覺/視頻分析 2022年 9月 8日

如今，人工智能驅動的應用程序正在實現更豐富的體驗，這是由更大和更復雜的人工智能模型以及許多模型在管道中的應用所推動的。 4 MIN READ

對話式人工智能/自然語言處理 2022年 8月 3日

這是討論 NVIDIA FasterTransformer 庫的兩部分系列的第一部分， 3 MIN READ

對話式人工智能/自然語言處理 2022年 8月 3日

這是關于 NVIDIA 工具的兩部分系列的第二部分，這些工具允許您運行大型Transformer模型以加速推理。 5 MIN READ