Posts by Justin Xin
對話式人工智能
2024年 8月 15日
NVIDIA TensorRT 模型優化器 v0.15 提高推理性能擴展模型支持能力
NVIDIA 宣布推出新版 v0.15 NVIDIA TensorRT 模型優化器,這是一種先進的模型優化技術量化工具包,包含量化、
2 MIN READ
生成式人工智能/大語言模型
2024年 3月 7日
NVIDIA TensorRT 通過 8 位預訓練量化將 Stable Diffusion 的速度提升近 2 倍
在生成式 AI 的動態領域,擴散模型脫穎而出,成為使用文本提示生成高質量圖像的功能強大的架構 .
3 MIN READ