精選 – NVIDIA 技術博客

NVIDIA Merlin 助力陌陌推薦業務實現高性能訓練優化

Thu, 09 Nov 2023 08:33:38 +0000

本案例中，NVIDIA 團隊與陌陌推薦系統團隊深度合作，共同使用 NVIDIA GPU 和 Merlin 軟件解決方案替代其原有解決方案。通過使用 Merlin TensorFlow Plugin （即 Sparse Operation Kit，SOK）和 HierarchicalKV（HKV)，相較于原方案在相同規模模型和 GPU 下，顯著提高了陌陌大規模深度多目標精排模型的訓練性能。在不影響模型效果的前提下，模型整體吞吐提升了 5 倍以上，再結合通信和 IO 等進一步優化后，極限情況下可以提升 12 倍吞吐。客戶簡介摯文集團于 2011 年成立，2014 年 12 月 11 日在美國納斯達克交易所掛牌上市（NASDAQ: MOMO），擁有陌陌、探探等多款手機應用，以及電影制作發行、節目制作等多元業務。陌陌是摯文集團于 2011 年 8…

Source

]]>

SDK 加速行業 5.0 、數據管道、計算科學等在 GTC 2023 上亮相

Wed, 22 Mar 2023 06:45:09 +0000

在 2023 年的 NVIDIA GTC 2023 上， NVIDIA 公布了其 NVIDIA AI 軟件套件的顯著更新，供開發者加速計算。這些更新降低了幾個領域的成本，例如使用 NVIDIA RAPIDS 的數據科學工作負載、使用 NVIDIA Triton 的模型分析、使用 NVID IA CV- CUDA 的人工智能成像和計算機視覺等。為了跟上 NVIDIA 最新的 SDK 進步，請觀看首席執行官黃仁勛的 GTC keynote 。 NVIDIA RAPIDS Accelerator for Apache Spark 現已在 NVIDIA AI Enterprise 3.1 軟件套件中提供。使用 Apache Spark 3 在不更改代碼的情況下加快數據處理和分析或模型培訓，同時降低基礎設施成本。亮點：立即申請，

Source

]]>

云計算中的 RAN ：向 5G RAN 提供云經濟

Mon, 13 Feb 2023 03:35:26 +0000

5G 部署在全球范圍內不斷加快。許多電信運營商已經推出了 5G 服務，并且正在快速擴張。除電信運營商外，企業對使用 5G 建立專用網絡也非常感興趣，這些網絡利用更高的帶寬、更低的延遲、網絡切片、 mmWave 和 CBRS 頻譜。 5G 的崛起恰逢一個有趣的時刻。在過去二十年中，云計算已經成熟，成為開發人員構建應用程序的首選。云提供了許多優勢，包括成熟的軟件工具、自動化和編排、業務靈活性和較低的總體擁有成本（ TCO ）。此外，各個領域的應用（工業機器人、云游戲、智能城市、安全、零售、自動駕駛、智能農業）越來越多地使用人工智能（ AI ）來實現變革性體驗。 5G 、云計算和人工智能的融合將在未來十年推動許多創新。 NVIDIA Aerial SDK 是構建虛擬無線電接入網絡（ vRAN ）的關鍵技術基礎。它是一個由軟件定義的完整 5G 第 1 層（ L1 ）卸載，

Source

]]>

使用 NVIDIA Jetson Nano 開發套件提高您的邊緣 AI 和機器人技能

Tue, 22 Nov 2022 09:50:00 +0000

你有興趣開始學習邊緣人工智能和機器人技術，但不知道從哪里開始？看看合作伙伴重新推出的 NVIDIA Jetson Nano 開發者套件，該套件將于 2022 年 11 月 25 日開始在美國和 12 月在全球發售。 3 年前推出的 NVIDIA Jetson Nano 是一款面向嵌入式和邊緣人工智能市場的低成本入門級人工智能計算機。憑借熟悉的 Linux 環境、易于遵循的教程，以及由活躍的開發人員社區創建的開源項目，它是邊干邊學的完美工具。這臺小巧而強大的計算機可以讓您并行運行多個神經網絡，用于圖像分類、對象檢測、分割和語音處理等應用。所有這些都被打包到一個易于使用的平臺中，該平臺的功耗僅為 5 瓦。去年，明尼蘇達大學的研究人員開發了一種 neuroprosthetic hand ，它使用基于遞歸神經網絡（ RNN ）的 AI…

Source

]]>

《時代》雜志將 NVIDIA Instant NeRF 評為 2022 年最佳發明

Sat, 12 Nov 2022 07:11:00 +0000

時代雜志將 NVIDIA 命名為 Instant NeRF ，這是一種能夠將 2D 圖像轉換為 3D 場景的技術，也是 2022 年最佳發明之一。 “在 NVIDIA Instant NeRF 之前，創建 3D 場景需要專門的設備、專業知識以及大量的時間和金錢。現在只需要幾張照片和幾分鐘，”《時代周刊》在其發布中寫道。 3D 渲染工具在 2022 年 SIGGRAPH 2022 上推出，這是世界上最大的計算機圖形和交互技術會議。在 SIGGRAPH 上， NVIDIA 研究人員托馬斯·穆勒、亞歷克斯·埃文斯、克里斯托夫·席德和亞歷山大·凱勒提交了他們的論文 Instant Neural Graphics Primitives with a Multiresolution Hash Encoding 。這項創新研究很快受到歡迎，

Source

]]>

深度了解 NVIDIA Grace Hopper 超級芯片架構

Thu, 10 Nov 2022 07:21:00 +0000

NVIDIA Grace Hopper 超級芯片架構是高性能計算（ HPC ）和 AI 工作負載的第一個真正的異構加速平臺。它利用 GPU 和 CPU 的優勢加速應用程序，同時提供迄今為止最簡單和最高效的分布式異構編程模型。科學家和工程師可以專注于解決世界上最重要的問題。在這篇文章中，您將了解 Grace Hopper 超級芯片的所有信息，并重點介紹 NVIDIA Grace Hoppper 所帶來的性能突破。有關 Grace Hopper 使用 NVIDIA Hopper H100 GPU 在最強大的基于 PCIe 的加速平臺上實現的加速的更多信息，請參閱 NVIDIA Grace Hopper Superchip Architecture 白皮書。 NVIDIA Grace Hopper 超級芯片架構將 NVIDIA Hopper GPU…

Source

]]>

CUDA Toolkit 11.8 揭示的新功能

Tue, 04 Oct 2022 07:45:00 +0000

NVIDIA 發布了最新的 CUDA 工具包軟件版本 11.8 。該版本的重點是通過新的硬件功能增強編程模型和 CUDA 應用程序加速。 NVIDIA Hopper 和 Ada Lovelace 中新的特定于體系結構的功能最初通過庫和框架增強公開。 NVIDIA Hopper 體系結構的完整編程模型增強將從 CUDA Toolkit 12 系列開始發布。 CUDA 11.8 有幾個重要特性。本文概述了關鍵功能。 CUDA 應用程序可以立即從新的 GPU 系列中增加的流式多處理器（ SM ）計數、更高的內存帶寬和更高的時鐘頻率中受益。 CUDA 和 CUDA 庫公開了基于 GPU 硬件體系結構增強的新性能優化。 NVIDIA 基于 11.7 中的惰性內核加載特性，在 CPU 模塊端添加了惰性加載。這意味著函數和庫在 CPU 上的加載速度更快，

Source

]]>

借助新的 NVIDIA Omniverse Replicator 功能，以前所未有的速度加快 AI 培訓

Wed, 21 Sep 2022 10:07:00 +0000

在 GTC 上宣布，技術藝術家、軟件開發人員和 ML 工程師現在可以使用 NVIDIA Omniverse Replicator 在云中構建自定義、物理精確的合成數據生成管道。 Omniverse Replicator 是一個構建在 NVIDIA Omniverse 平臺上的高度可擴展框架，它支持物理精確的 3D 合成數據生成，以加快感知網絡的訓練和準確性。 Omniverse Replicator 現在可以通過 NVIDIA NGC 上托管的容器部署在云端中， SaaS 可供應用程序早期訪問。 Replicator 工具和內容套件現在還包括一個新的 Replicator Insight 應用程序，用于增強對生成數據的查看和檢查，以及新的 SimReady 內容和即插即用合成數據工作流指南。許多合作伙伴正在其現有工具中集成 Omniverse Replicator ，

Source

]]>

GTC 宣布為 NVIDIA Omniverse 開發者提供新的云應用程序、 SimReady 資產和工具

Wed, 21 Sep 2022 09:52:00 +0000

世界各地的開發者、創作者和企業都在使用 NVIDIA Omniverse 構建虛擬世界，并突破元宇宙的界限。Omniverse 是一個基于 Universal Scene Description（USD，一種用于描述虛擬世界的可擴展通用語言）的可擴展計算平臺，它適用于全保真設計 3D 模擬工作流，全球各行業的開發者都在使用它構建 3D 互聯網。在GTC 大會主題演講中，NVIDIA 宣布推出重要版本 Omniverse，其中新增了 Omniverse Cloud 托管服務和容器部署，并提供了新的開發者工具包以及面向開發者的開放式發布渠道。借助新版本及新增功能，開發者可以更輕松地構建、擴展 3D 工具和平臺，并將其連接到 Omniverse 生態系統中。作為 NVIDIA 的第一款軟件即服務（SaaS）產品，

Source

]]>

全棧創新為 NVIDIA 最高 MLPerf 推斷 2.1 結果提供燃料

Thu, 08 Sep 2022 05:50:00 +0000

如今，人工智能驅動的應用程序正在實現更豐富的體驗，這是由更大和更復雜的人工智能模型以及許多模型在管道中的應用所推動的。為了滿足注入人工智能的應用程序日益增長的需求，人工智能平臺不僅必須提供高性能，而且必須具有足夠的通用性，以便在各種人工智能模型中提供這種性能。為了最大限度地提高基礎設施利用率并優化 CapEx ，在同一基礎設施上運行整個 AI 工作流的能力至關重要：從數據準備和模型培訓到部署推理。 MLPerf 基準已成為行業標準、同行評議的深度學習績效衡量標準，涵蓋人工智能培訓、人工智能推理和高性能計算（ HPC ）。 MLPerf 推斷 2.1 是 MLPerf 推理基準套件的最新迭代，涵蓋了廣泛的常見 AI 用例，包括推薦、自然語言處理、語音識別、醫學成像、圖像分類和對象檢測。在這一輪中， NVIDIA 在最新 NVIDIA H100 Tensor Core GPU…

Source

]]>