季光

NVIDIA GPU 加速計算專家團隊經理 NVIDIA DevTech 團隊經理,博士畢業于中科院計算所。擅長 GPU 加速的視頻處理以及性能優化,以及深度學習模型的推理優化,在 GPU 視頻編解碼以及 CUDA 編程與優化方面積累了豐富的經驗。

Posts by 季光

生成式人工智能/大語言模型

阿里安全使用 NVIDIA NeMo 框架和 TensorRT-LLM 的大模型工程化落地實踐

隨著 ChatGPT 的一夜爆火,大模型如今越來越廣泛的應用到各種業務領域中,阿里安全的業務領域對大模型技術的應用也已經 2 年有余。 4 MIN READ
人工智能/深度學習

如何在 NVIDIA TensorRT-LLM 中支持 Qwen 模型

大型語言模型正以其驚人的新能力推動人工智能的發展,擴大其應用范圍。然而,由于這類模型具有龐大的參數規模,部署和推理的難度和成本極高, 2 MIN READ