AI Inference – NVIDIA Technical Blog

DataStax, NVIDIA AI? ??? ??? AI ?? ??? ??

Fri, 18 Oct 2024 05:44:44 +0000

Reading Time: 4 minutes AI ??? ?? ? ?? ???? ???? ??? ??? ???? ?? AI ??????? ????? ??, ???? ????? ???? ?? ??? ??? ??? ????. AI ??? ????? ??? ???? ???? ???? ???? ??? ????? ???? ????, ?? ?? ??? ???? ???? ??? ???? AI ?? ??? ?? ? ????. ??? ?? DataStax? NVIDIA? ???? ?? NVIDIA … Continued]]>

NVLink Switch? ??? NVIDIA HGX H200? Medusa? ?? 1.9? ??? Llama 3.1 ??

Fri, 30 Aug 2024 02:57:10 +0000

Reading Time: 3 minutes ?? ?? ??(LLM)? ??? ???? ?? ???? ??, ??? ??? AI ??????? ???? ?? ?? ??? ?? ???? ???? ???? ?? GPU ???? ?????. ??? ??? GPU ? ??? ?? ??? GPU? ‘??? ??? GPU’?? ??? ???? ??? ?? GPU? ??? ??? ? ?? ?? ?????? ?? ?????. ?? ???? ?? ?? ????? ?? ?? … Continued]]>

LLM ?? ?? ?? ? ?? ???? ?? ???? ??

Fri, 23 Aug 2024 02:35:59 +0000

Reading Time: < 1 minute ??, ??? ?? ? ??? ???????? ?? ?? ??(LLM)? ??? ???? ?? ?? ???? ???? ????? ??? ???? LLM ??? ?? ???? ? ???? ?? ??? ??? ??? ??? ?? ???????. ?? ?????? NVIDIA? ?? ? ?? ??? ????? Dmitry Mironov? Sergio Perez? LLM ?? ???? ??? ??? ?????. ?? ??, ?? ??, ?? ????? … Continued]]>

CUDA ???? llama.cpp AI ?? ?????

Fri, 09 Aug 2024 05:05:33 +0000

Reading Time: 5 minutes ?? ??? llama.cpp ?? ???? ?? 2023?? ??? ???? ???? ??????? Meta Llama ??? ?? ??? ???? ?? ????. ???? ??? GGML ?????? ???? ??? Llama.cpp? ??? ??? ?? C/C++? ??? ?? ??? ?? ???? ???(?? ??? ???????? ????? ??)?? ??? ??? ?????. ?? ??? ??, llama.cpp? ??? ??, ??? ?? ??? ?? ??? NVIDIA … Continued]]>

???? ?? RAG ????? ??

Wed, 07 Aug 2024 04:02:54 +0000

Reading Time: 5 minutes ??? ???? AI ?? ?????? ???? ???? ?? ?? ??? ???? ???? ????? ?? ??? ??????. ???? ?? ?? ?? ????? ??? ?? ?? ??? ???? ??? ??? ? ? ??? ?????? ??? ??? ???? ?? ??????. ?? ?? ?? ???? ??? ?? ??? ?????? ??? ???? ??? ???? ??? ??? ?? ? ????. ?? ???? ?? ?? ??(RAG) ?????? ????? ? ??? ??? ??, ?? ?? ?? ?? ??(LLM)? ?? ???? ?? ???? ??? ??? ? ??? ?????. ??? ??? RAG ?????? ?? ????? ???? ?…

Source

]]>

?????? NVIDIA TensorRT 10.0? ???, ??, AI ?? ??

Wed, 29 May 2024 07:47:46 +0000

Reading Time: 4 minutes NVIDIA? ?? ??? ? ?? ??? ?? API ?????? NVIDIA TensorRT? ?? ???? ??????. TensorRT?? ???? ??????? ?? ??? ?? ???? ?? ?? ??? ? ?? ???? ?????. ? ?????? ??? ??, ??? ???, ??? ??, ????? ???? ?? AI ??? ???? ?? ???? ?? ?? ? ?????? ???? ?????. ??? ?? ????? Debian ? … Continued]]>

NVIDIA TensorRT Model Optimizer? ??? AI ?? ?? ???

Fri, 17 May 2024 02:26:54 +0000

Reading Time: 6 minutes ??? ???? ??? AI ???? ???? ?? ??? ?? ??? ??? ??? ?????. ?? ??? ???? ??????? ???? ?? ??? ????? ??? ???? ???? ?? ???? ??? ???? ? ???? ?? ??? ????. NVIDIA ???? ??? ??? ????? ?, ???, ?????, ???? ? ?? ?? ??? ?? ??? ?? ???? ?? ??? ?????. NVIDIA? ??? … Continued]]>

NVIDIA TensorRT-LLM ? NVIDIA Triton Inference Server? Meta Llama 3 ?? ??

Fri, 03 May 2024 06:10:25 +0000

Reading Time: 5 minutes LLM ?? ??? ??? ? ????? NVIDIA TensorRT-LLM? Meta Llama 3 ?? ???? ?? ??? ?????. ???? ??? ?????? ?? ???? ? ?? ??? Llama 3 8B ? Llama 3 70B? ?? ??? ? ? ????. ?? NVIDIA API ????? ??? ???? NVIDIA ???? ???? API ?????? ?? Llama 3? ???? ??? ? ?? ?? … Continued]]>

NVIDIA TensorRT-LLM?? LoRA LLM ?? ? ??

Thu, 18 Apr 2024 07:04:12 +0000

Reading Time: 10 minutes ?? ?? ??(LLM)? ??? ?? ???? ???? ??? ?? ? ??? ?? ???? ??? ???? ???? ???? ??? ??(NLP)? ??????.?????LLM? ????? ?? ???? ????, ??? ?? ??? ?? ????? ???????? ??? ??? ????.??? LLM? ????? ???? ??? ?? ?????? ????, ?? ???? ????? ??? ? ????. ??? ??? ?? ?? ??? ???? ?? LLM? ??? … Continued]]>

?? ?? ???? LLM ???? ? ??? ??? ???? NVIDIA GB200 NVL72

Wed, 03 Apr 2024 06:05:57 +0000

Reading Time: 6 minutes ? ?? ???? ??? ?? ???? ?? ??? ?? ?? ??? ???, ??? ?? ??? ??? ??? ? ??? ??? ?? ??? ??? ????: ??? ??? ??? ??? ???? ???? ?? ?? ??? ?? ?? ??? ???? ? ????. ??? ??? ????? ??? ?? ????? ?? ????? ??? ???? ???? ???? ??? ?? ?????. ??? … Continued]]>