Posts by Denis Timonin
對話式人工智能/自然語言處理
2022年 8月 3日
使用 FasterTransformer 和 Triton 推理服務器加速大型?Transformer?模型的推理
這是討論 NVIDIA FasterTransformer 庫的兩部分系列的第一部分,
3 MIN READ
對話式人工智能/自然語言處理
2022年 8月 3日
使用 FasterTransformer 和 Triton 推理服務器部署 GPT-J 和 T5
這是關于 NVIDIA 工具的兩部分系列的第二部分,這些工具允許您運行大型Transformer模型以加速推理。
5 MIN READ