NVIDIA TensorRT
??? ? ?? ??? ?? SDK? NVIDIA? TensorRT??? ?? ??????? ?? ?? ??? ?? ???? ???? ? ?? ?? ?????? ???? ???? ????.
?? ???? ?? ????NVIDIA TensorRT? ?? ???????
?? ??? 36? ??
NVIDIA TensorRT ?? ??????? CPU ?? ????? ?? ??? ?? 36? ? ??? ??? ?? ?? ??????? ??? ??? ??? ?????, ??? ??? ?? ???? ????, ?????? ??? ??, ???? ??? ?? ??? ?? ???? ??? ??? ? ????.
?? ?? ???
NVIDIA CUDA? ?? ????? ??? ???? ?? TensorRT? ???? NVIDIA AI, ????? ??, ??? ??? ? ????? ?????? ?? ? ? ??? ??? ??? ???? ? ????. ?? NVIDIA Hopper? ? NVIDIA Ampere Architecture GPU?? ?? Tensor Core? ??? ??? ??? ?????.
?? ???? ???
TensorRT? ??? ????, ??, ?? ??, ??? ?? ?? ? ?? ?? ??????? ??? ? ??? ??? ?? ??? ?? ? ??? ? FP16 ???? ???? INT8? ?????. ??? ???? ???? ?? ??? ?? ?????, ?? ??? ???? ????? ? ???? ??????? ??? ?????. .
Triton? ?? ??, ?? ? ??
??? ? ??? TensorRT? ???? ?? ?? ?? ?? ?? ?????? NVIDIA Triton?? ??? TensorRT? ???? ??? ??, ?? ? ??? ? ????. Triton? ???? ?? ??? ?? ?? ??? ??? ?? ???, ???? ???/??? ?? ?? ??? ???? ???? ?? ? ??? ??? ????.
?? ??? ?? ??
MLPerf Inference? ?? ?? ?? ?????? NVIDIA? ?? ?? ???? ??? ?? ?? TensorRT ?????. ?? ??? ??, ?? ?? ??, ??? ??(BERT), ??? ?? ?? ? ?? ????? ??? ??? ?? ??? ?? ?? ????? ?????.
??? AI
??? ??
?? ???
?? ?? ????? ??
TensorRT? PyTorch ? TensorFlow? ???? ??? ? ? ?? ????? ?? ??? 6? ?? ? ????. ?? ?? ??? ??????? ? ?? ??? ?? ?? ???? TensorRT C++ API? ??? ??? ???? ??? ? ????. TensorRT ???? ??? ??? ?????.
?? ??? ?? ??? ?? ? ?? ?? ??? ??? ?? ????.
?? ?? ??? ???
TensorRT? ??????? ????? ?? ??? ??? ???? ??? ? ??? ???? ??? ? ???, NVIDIA TAO, NVIDIA DRIVE?, NVIDIA Clara?, NVIDIA Jetpack?? ?? ?? NVIDIA ???? ?????.
?? NVIDIA DeepStream, NVIDIA Riva, NVIDIA Merlin?, NVIDIA Maxine?, NVIDIA Modulus, NVIDIA Morpheus, Broadcast Engine? ?? ??????? SDK?? ?? ?? ???? ???? ??? ??? ??? ??? ?? AI ??, ?? ???, ?? ??, AI ?? ??? ?? ? ???? ?? ???? ? ??? ?? ??? ?????.

Triton ????? ???? ?? ?? ????, ?? ?? ?? ?? ?? ??? ?????.
?? ?? ??
???

???? ??? ????
?????? ?? ???? ??????? NVIDIA AI ????? ????? TensorRT? ?? NVIDIA ??? ?? ???? ?????.