Posts by 薛博陽
加速計算
2024年 4月 25日
NVIDIA GPU 架構下的 FP8 訓練與推理
本文聚焦 NVIDIA FP8 訓練與推理的實踐應用,該內容來源于 2023 云棲大會 NVIDIA 專場演講。 FP8 訓練利用 E5M2/
5 MIN READ
生成式人工智能/大語言模型
2024年 3月 19日
FP8:前沿精度與性能的新篇章
在深度學習和人工智能的快速發展背景下,尤其是大語言模型(Large Language Model, LLM)的蓬勃發展,
3 MIN READ
計算機視覺/視頻分析
2022年 9月 8日
全棧創新為 NVIDIA 最高 MLPerf 推斷 2.1 結果提供燃料
如今,人工智能驅動的應用程序正在實現更豐富的體驗,這是由更大和更復雜的人工智能模型以及許多模型在管道中的應用所推動的。
4 MIN READ
對話式人工智能/自然語言處理
2022年 8月 3日
使用 FasterTransformer 和 Triton 推理服務器加速大型?Transformer?模型的推理
這是討論 NVIDIA FasterTransformer 庫的兩部分系列的第一部分,
3 MIN READ
對話式人工智能/自然語言處理
2022年 8月 3日
使用 FasterTransformer 和 Triton 推理服務器部署 GPT-J 和 T5
這是關于 NVIDIA 工具的兩部分系列的第二部分,這些工具允許您運行大型Transformer模型以加速推理。
5 MIN READ