在產品開發的早期,組織經常尋求評估項目的最低硬件需求。這通常需要在芯片上購買幾個具有不同系統的開發套件來測量原型性能。評估階段可能會延遲,這取決于開發人員工具包的可用性,這反過來會延遲上市時間。
幸運的是,只需使用 Jetson AGX Orin 開發套件 。此開發套件使您能夠在本地模擬任何 NVIDIA Jetson Orin 模塊,包括 Jetson Orin NX 和 Jetson Orin Nano 。它模擬所選模塊的硬件規范,從而復制其性能。有關詳細信息,請參閱 利用一個開發套件的力量開發所有六個 NVIDIA Jetson Orin 模塊 并訪問 Jetson 下載中心 .
仿真功能的主要優點是,您只需要一個套件即可開發針對任何 Jetson Orin 模塊的任何產品。這加快了原型階段,但也大大降低了成本。
這篇文章向您展示了如何使用一個開發工具包來仿真不同的 Jetson 模塊,并總結了通過仿真 Jetson Orin NX 獲得的性能。請注意,雖然 Jetson Orin Nano 也可以仿真,但這里沒有討論,因為這些模塊不包括用于視頻編碼的硬件單元。因此,性能測量不會在 Jetson Orin NX 和 Jetson AGX Orin 相同的條件下進行。
使用 全景拼接和 WebRTC 流參考設計 測量性能。本演示使用 Jetson AGX Orin 開發套件,從三個不同的魚眼攝像頭實時創建 360 度全景圖像。該過程使用 RidgeRun 用于 NVIDIA Jetson 的 GstStitcher 圖像拼接 。然后使用帶有 RidgeRun WebRTCWrapper 的 WebRTC 將結果流式傳輸到遠程瀏覽器。圖 1 顯示了結果的示例。

參考設計使用 NVIDIA Jetson AGX Orin 中可用的以下硬件單元:
- CPU : RTSP 攝像機視頻捕獲、緩沖區處理和 WebRTC 流
- NVENC : H.264 硬件加速編碼
- VIC :魚眼投影轉換為部分等矩形圖像; 1080p 傳輸的邊界裁剪和圖像縮放
- GPU :將部分等矩形圖像拼接成單個表示
如何在 NVIDIA Jetson AGX Orin 開發套件上啟用仿真
要啟用仿真,請使用 NVIDIA Jetson AGX Orin 開發套件的閃爍功能。這種方法使您能夠選擇目標模塊,然后使用該配置閃存板。
假設 NVIDIA JetPack 5.0.2 安裝正常,第一步是將主板置于強制恢復模式。然后使用flash.sh
命令行工具為目標模塊選擇適當的閃爍腳本。可用的閃爍命令見表 1 。
Target module | Flashing command |
Jetson AGX Orin 64 GB | sudo ./flash.sh jetson-agx-orin-devkit mmcblk0p1 |
Jetson AGX Orin 32 GB | sudo ./flash.sh jetson-agx-orin-devkit-as-jao-32gb mmcblk0p |
Jetson Orin NX 16 GB | sudo ./flash.sh jetson-agx-orin-devkit-as-nx16gb mmcblk0p1 |
Jetson Orin NX 8 GB | sudo ./flash.sh jetson-agx-orin-devkit-as-nx8gb mmcblk0p1 |
Jetson Orin Nano 8 GB | sudo ./flash.sh jetson-agx-orin-devkit-as-nano8gb mmcblk0p1 |
Jetson Orin Nano 4 GB | sudo ./flash.sh jetson-agx-orin-devkit-as-nano4gb mmcblk0p1 |
閃爍過程完成后,開發工具包將自動重新啟動。完成初始啟動過程后,可以使用 NVIDIA SDK 管理器安裝剩余的 NVIDIA JetPack 組件。或者,您可以運行以下命令:
sudo apt update
sudo apt install nvidia-jetpack
要了解更多信息,請參閱 NVIDIA Jetson Orin 閃爍命令用于仿真 .
Performance results
RidgeRun 參考設計使用 Jetson AGX Orin 開發套件執行,該套件配置為在 MAXN 功率設置下模擬 Jetson Orin NX 16 GB 。
圖 2 顯示,與模擬 NVIDIA Jetson Orin NX 時的負載相比,開發套件 Jetson AGX Orin CPU 上的負載稍小。這是意料之中的,因為與 Jetson Orin NX 16 GB 的八個內核相比,開發套件在 12 個內核上運行。

圖 3 顯示 CUDA AGX-Orin 上的 GPU 負載幾乎是 Jetson Orin NX 16 GB 上相同負載的一半。考慮到開發套件 Jetson AGX Orin 模塊具有 2048 個 CUDA 內核,而 NVIDIA Jetson Orin NX 上的 1024 個 Jetson 內核,結果是預期的。這兩個選項都為參考設計中使用的所有視頻保持了 30 FPS 的穩定流。圖 2 和圖 3 所示的結果表示每個度量的 55 個樣本的平均值。

NVIDIA Jetson Orin NX 的八個 CPU 中的每一個的性能如圖 4 所示。負載通常在 10% 至 35% 之間,頻率范圍為 729 MHz 至 2000 MHz 。

圖 5 顯示, GPU 負載在 10% 至 80% 之間變化,頻率大部分時間保持在 611MHz 。

表 2 顯示了 Jetson AGX Orin 開發套件在仿真 Jetson Orin NX 時測得的性能。將此與表 3 進行比較,表 3 顯示了在 Jetson AGX Orin 開發套件上無仿真的全景縫合和 WebRTC 流演示的硬件性能。
總之, Jetson Orin NX 獲得了與 Jetson AGX Orin 相同的結果。不同之處在于資源使用, Jetson Orin NX 的資源使用更高。這是由于硬件的差異而導致的。
例如, Jetson Orin NX 在八個 CPU 核上運行, Jetson AGX Orin 在 12 個 CPU 核上。 Jetson Orin NX 上的 CPU 的最大頻率也降低了。此外, Jetson Orin NX 上的 GPU 在具有 32 個 Tensor 核的 1024 核 NVIDIA Ampere 架構 GPU 上運行,而 Jetson AGX Orin 在具有 64 個 Tensor 核的 2048 核 NVIDIA Ampere 架構 GPU 上運行。


總結
全景拼接和 WebRTC 流參考設計 僅使用 NVIDIA Jetson AGX Orin 開發套件及其仿真功能,使用兩種不同的硬件規格進行了測試。運行參考設計表明,盡管 NVIDIA Jetson Orin NX 具有更精簡的硬件規格,但它運行演示以及更強大的硬件。
觀看在兩個平臺上運行的全景縫合和 WebRTC 流參考設計。視頻還包括參考設計及其工作原理的簡要說明。
Video 1. 了解 NVIDIA Jetson Orin 開發套件的仿真性能
有關 NVIDIA Jetson AGX Orin 仿真功能的更多信息,請參閱 利用一個開發套件的力量開發所有六個 NVIDIA Jetson Orin 模塊 .