使用 NVIDIA Jetson AGX Orin 開發套件模擬 NVIDIA Jetson Orin NX

在產品開發的早期，組織經常尋求評估項目的最低硬件需求。這通常需要在芯片上購買幾個具有不同系統的開發套件來測量原型性能。評估階段可能會延遲，這取決于開發人員工具包的可用性，這反過來會延遲上市時間。

幸運的是，只需使用 Jetson AGX Orin 開發套件。此開發套件使您能夠在本地模擬任何 NVIDIA Jetson Orin 模塊，包括 Jetson Orin NX 和 Jetson Orin Nano 。它模擬所選模塊的硬件規范，從而復制其性能。有關詳細信息，請參閱利用一個開發套件的力量開發所有六個 NVIDIA Jetson Orin 模塊并訪問 Jetson 下載中心 .

仿真功能的主要優點是，您只需要一個套件即可開發針對任何 Jetson Orin 模塊的任何產品。這加快了原型階段，但也大大降低了成本。

這篇文章向您展示了如何使用一個開發工具包來仿真不同的 Jetson 模塊，并總結了通過仿真 Jetson Orin NX 獲得的性能。請注意，雖然 Jetson Orin Nano 也可以仿真，但這里沒有討論，因為這些模塊不包括用于視頻編碼的硬件單元。因此，性能測量不會在 Jetson Orin NX 和 Jetson AGX Orin 相同的條件下進行。

使用全景拼接和 WebRTC 流參考設計測量性能。本演示使用 Jetson AGX Orin 開發套件，從三個不同的魚眼攝像頭實時創建 360 度全景圖像。該過程使用 RidgeRun 用于 NVIDIA Jetson 的 GstStitcher 圖像拼接。然后使用帶有 RidgeRun WebRTCWrapper 的 WebRTC 將結果流式傳輸到遠程瀏覽器。圖 1 顯示了結果的示例。

A screenshot showing a demo of NVIDIA Jetson AGX Orin from RidgeRun with Panoramic Stitching and WebRTC Streaming. — *圖 1 。 RidgeRun 的 NVIDIA Jetson AGX Orin 演示，顯示全景拼接和 WebRTC 流*

參考設計使用 NVIDIA Jetson AGX Orin 中可用的以下硬件單元：

CPU ： RTSP 攝像機視頻捕獲、緩沖區處理和 WebRTC 流
NVENC ： H.264 硬件加速編碼
VIC ：魚眼投影轉換為部分等矩形圖像； 1080p 傳輸的邊界裁剪和圖像縮放
GPU ：將部分等矩形圖像拼接成單個表示

如何在 NVIDIA Jetson AGX Orin 開發套件上啟用仿真

要啟用仿真，請使用 NVIDIA Jetson AGX Orin 開發套件的閃爍功能。這種方法使您能夠選擇目標模塊，然后使用該配置閃存板。

假設 NVIDIA JetPack 5.0.2 安裝正常，第一步是將主板置于強制恢復模式。然后使用flash.sh命令行工具為目標模塊選擇適當的閃爍腳本。可用的閃爍命令見表 1 。

Target module	Flashing command
Jetson AGX Orin 64 GB	sudo ./flash.sh jetson-agx-orin-devkit mmcblk0p1
Jetson AGX Orin 32 GB	sudo ./flash.sh jetson-agx-orin-devkit-as-jao-32gb mmcblk0p
Jetson Orin NX 16 GB	sudo ./flash.sh jetson-agx-orin-devkit-as-nx16gb mmcblk0p1
Jetson Orin NX 8 GB	sudo ./flash.sh jetson-agx-orin-devkit-as-nx8gb mmcblk0p1
Jetson Orin Nano 8 GB	sudo ./flash.sh jetson-agx-orin-devkit-as-nano8gb mmcblk0p1
Jetson Orin Nano 4 GB	sudo ./flash.sh jetson-agx-orin-devkit-as-nano4gb mmcblk0p1

表 1 。每個 Jetson Orin 模塊可用的閃爍命令

閃爍過程完成后，開發工具包將自動重新啟動。完成初始啟動過程后，可以使用 NVIDIA SDK 管理器安裝剩余的 NVIDIA JetPack 組件。或者，您可以運行以下命令：

sudo apt update
sudo apt install nvidia-jetpack

要了解更多信息，請參閱 NVIDIA Jetson Orin 閃爍命令用于仿真 .

Performance results

RidgeRun 參考設計使用 Jetson AGX Orin 開發套件執行，該套件配置為在 MAXN 功率設置下模擬 Jetson Orin NX 16 GB 。

圖 2 顯示，與模擬 NVIDIA Jetson Orin NX 時的負載相比，開發套件 Jetson AGX Orin CPU 上的負載稍小。這是意料之中的，因為與 Jetson Orin NX 16 GB 的八個內核相比，開發套件在 12 個內核上運行。

Bar graph showing comparison of the CPU load while running Panoramic Stitching and WebRTC Streaming Demo using the Jetson AGX Orin Developer Kit for emulation. — *圖 2 .運行 Panoramic Stitching 和 WebRTC Streaming 演示時的 CPU 負載比較*

圖 3 顯示 CUDA AGX-Orin 上的 GPU 負載幾乎是 Jetson Orin NX 16 GB 上相同負載的一半。考慮到開發套件 Jetson AGX Orin 模塊具有 2048 個 CUDA 內核，而 NVIDIA Jetson Orin NX 上的 1024 個 Jetson 內核，結果是預期的。這兩個選項都為參考設計中使用的所有視頻保持了 30 FPS 的穩定流。圖 2 和圖 3 所示的結果表示每個度量的 55 個樣本的平均值。

Bar graph showing comparison of the GPU load while running Panoramic Stitching and WebRTC Streaming Demo using the Jetson AGX Orin Developer Kit for emulation. — *圖 3.GPU 運行全景縫合和 WebRTC 流演示時的負載比較*

NVIDIA Jetson Orin NX 的八個 CPU 中的每一個的性能如圖 4 所示。負載通常在 10% 至 35% 之間，頻率范圍為 729 MHz 至 2000 MHz 。

Chart demonstrating the CPU load and frequency results of the Panoramic Stitching and WebRTC Streaming Demo. — *圖 4 .運行 Panoramic Stitching 和 WebRTC Streaming 演示的 CPU 負載和頻率結果*

圖 5 顯示， GPU 負載在 10% 至 80% 之間變化，頻率大部分時間保持在 611MHz 。

Chart showing the GPU load and frequency results of running the Panoramic Stitching and WebRTC Streaming Demo. — *圖 5 .運行 Panoramic Stitching 和 WebRTC Streaming 演示的 GPU 負載和頻率結果*

表 2 顯示了 Jetson AGX Orin 開發套件在仿真 Jetson Orin NX 時測得的性能。將此與表 3 進行比較，表 3 顯示了在 Jetson AGX Orin 開發套件上無仿真的全景縫合和 WebRTC 流演示的硬件性能。

總之， Jetson Orin NX 獲得了與 Jetson AGX Orin 相同的結果。不同之處在于資源使用， Jetson Orin NX 的資源使用更高。這是由于硬件的差異而導致的。

例如， Jetson Orin NX 在八個 CPU 核上運行， Jetson AGX Orin 在 12 個 CPU 核上。 Jetson Orin NX 上的 CPU 的最大頻率也降低了。此外， Jetson Orin NX 上的 GPU 在具有 32 個 Tensor 核的 1024 核 NVIDIA Ampere 架構 GPU 上運行，而 Jetson AGX Orin 在具有 64 個 Tensor 核的 2048 核 NVIDIA Ampere 架構 GPU 上運行。