Zhiyu Cheng

Zhiyu Cheng 是 NVIDIA 的技術負責人經理,負責推動 NVIDIA GPU 和云服務 (NeMo/Picasso) 的大型語言模型 (LLM) 和擴散模型優化。在他的職業生涯中,Zhiyu 曾在 NXP、Xilinx、百度和 OmniML (已被 NVIDIA 收購) 擔任過高效機器學習和深度學習的職位,擁有超過 10 年的經驗 .Zhiyu 擁有超過 30 篇已發表的論文和專利。他擁有伊利諾伊大學電氣和計算機工程博士學位,論文涉及信息理論領域。

Posts by Zhiyu Cheng

對話式人工智能

NVIDIA TensorRT 模型優化器 v0.15 提高推理性能擴展模型支持能力

NVIDIA 宣布推出新版 v0.15 NVIDIA TensorRT 模型優化器,這是一種先進的模型優化技術量化工具包,包含量化、 2 MIN READ
生成式人工智能/大語言模型

NVIDIA TensorRT 通過 8 位預訓練量化將 Stable Diffusion 的速度提升近 2 倍

在生成式 AI 的動態領域,擴散模型脫穎而出,成為使用文本提示生成高質量圖像的功能強大的架構 . 3 MIN READ