高慧怡

NVIDIA 深度學習解決方案架構師 2020 年加入 NVIDIA 解決方案架構團隊,從事深度學習應用在異構系統的加速工作,目前主要支持國內 CSP 客戶在大語言模型的訓練加速工作。

Posts by 高慧怡

加速計算

探索 FP8 訓練中 Debug 思路與技巧

目前,市場上許多公司都積極開展基于 FP8 的大模型訓練,以提高計算效率和性能。 在此, 2 MIN READ
生成式人工智能/大語言模型

阿里安全使用 NVIDIA NeMo 框架和 TensorRT-LLM 的大模型工程化落地實踐

隨著 ChatGPT 的一夜爆火,大模型如今越來越廣泛的應用到各種業務領域中,阿里安全的業務領域對大模型技術的應用也已經 2 年有余。 4 MIN READ
加速計算

NVIDIA GPU 架構下的 FP8 訓練與推理

本文聚焦 NVIDIA FP8 訓練與推理的實踐應用,該內容來源于 2023 云棲大會 NVIDIA 專場演講。 FP8 訓練利用 E5M2/ 5 MIN READ