使用 NVIDIA Triton 模型分析器確定規模上的最佳 AI 模型服務配置

Mon, 23 May 2022 04:32:00 +0000

模型部署是機器學習生命周期的一個關鍵階段，在此階段，經過培訓的模型將集成到現有的應用程序生態系統中。這往往是最繁瑣的步驟之一，在這些步驟中，目標硬件平臺應滿足各種應用程序和生態系統約束，所有這些都不會影響模型的準確性。 NVIDIA Triton 推理服務器是一個開源的模型服務工具，它簡化了推理，并具有多個功能以最大限度地提高硬件利用率和推理性能。這包括以下功能：有關更多信息，請參閱使用 NVIDIA Triton 推理服務器快速、可擴展的 AI 模型部署 . 優化模型部署時，需要做出幾個關鍵決策：這些關鍵決策導致了組合爆炸，每種型號和硬件選擇都有數百種可能的配置。通常，這會導致浪費開發時間或代價高昂的低于標準的服務決策。在本文中，我們將探討 NVIDIA Triton 型號分析儀可以自動瀏覽目標硬件平臺的各種服務配置，

Source

]]>

Arun Raman – NVIDIA 技術博客

使用 NVIDIA Triton 模型分析器確定規模上的最佳 AI 模型服務配置