Charlie Huang – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Tue, 29 Oct 2024 06:54:52 +0000 zh-CN hourly 1 196178272 借助 Google Kubernetes Engine 和 NVIDIA NIM 實現高性能 AI 推理擴展 http://www.open-lab.net/zh-cn/blog/scale-high-performance-ai-inference-with-google-kubernetes-engine-and-nvidia-nim/ Wed, 16 Oct 2024 06:50:10 +0000 http://www.open-lab.net/zh-cn/blog/?p=11724 Continued]]> AI 模型的快速演進推動了對更高效、更可擴展的推理解決方案的需求。在企業組織努力利用 AI 的強大功能時,他們在部署、管理和擴展 AI 推理工作負載方面面臨挑戰。 NVIDIA NIM 和 Google Kubernetes Engine (GKE) 共同提供了應對這些挑戰的強大解決方案。NVIDIA 與 Google Cloud 合作,在 GKE 上引入 NVIDIA NIM,以加速 AI 推理,通過 Google Cloud Marketplace 提供的簡化部署,在大規模提供安全、可靠和高性能的推理。 NVIDIA NIM 是 NVIDIA AI Enterprise 軟件平臺的一部分,現已在 Google Cloud Marketplace 上提供。它是一套易于使用的微服務,旨在安全、可靠地部署高性能 AI 模型推理。NIM 現已與 GKE 集成,

Source

]]>
11724
Google Cloud Run 現已支持 NVIDIA L4 GPU、NVIDIA NIM 及大規模無服務器 AI 推理部署 http://www.open-lab.net/zh-cn/blog/google-cloud-run-adds-support-for-nvidia-l4-gpus-nvidia-nim-and-serverless-ai-inference-deployments-at-scale/ Wed, 21 Aug 2024 09:24:43 +0000 http://www.open-lab.net/zh-cn/blog/?p=11018 Continued]]> 部署 AI 賦能的應用和服務給企業帶來了重大的挑戰: 應對這些挑戰需要一種全棧方法,該方法可以優化性能、有效管理可擴展性并駕部署的復雜性,使組織能夠在保持運營效率和成本效益的同時最大限度地發揮AI的全部潛力。 Google Cloud 和 NVIDIA 攜手合作,通過結合 NVIDIA AI 平臺的性能和云端無服務器計算的易用性,應對這些挑戰并簡化 AI 推理部署。 Google Cloud 的完全托管式無服務器容器運行時 Cloud Run 增加了對 NVIDIA L4 Tensor Core GPU 的支持(可在預覽版中獲取)。現在,您可以按需運行大規模加速的實時 AI 應用程序,而無需擔心基礎設施管理。結合 NVIDIA NIM 微服務的強大功能,Cloud Run 能夠顯著簡化生產優化和服務 AI 模型的復雜性,同時更大限度地提高應用程序性能。

Source

]]>
11018
通過新的 NVIDIA AI 企業集成擴展虛擬化數據中心中的混合云支持 http://www.open-lab.net/zh-cn/blog/expanding-hybrid-cloud-support-in-virtualized-data-centers-with-new-nvidia-ai-enterprise-integrations/ Mon, 14 Mar 2022 10:15:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=3314 Continued]]> 新的一年已經有了一個很好的開端, NVIDIA AI Enterprise 1.1 使用 VMware vSphere 與 Tanzu 7.0 Update 3c 為容器編排和 Kubernetes 群集管理提供生產支持,為 VMs 、容器或 Kubernetes 中的每個企業提供 AI / ML 工作負載。 可在 NVIDIA LaunchPad 上獲得針對 IT 管理員和 MLOP 的新 NVIDIA AI 企業實驗室: 通過免費的 LaunchPad 計劃,企業可以快速開始在 VMware vSphere 上與 Tanzu 一起運行 NVIDIA 人工智能企業 ,該計劃提供對運行在私有加速計算基礎設施上的 NVIDIA AI 的即時、短期訪問。 一個新添加的 Calabor 實驗室提供了使用 VMware Tanguu KubNeNETGrand 服務的經驗,

Source

]]>
3314
人人超碰97caoporen国产