NVIDIA NetQ 是一種高度可擴展的現代網絡操作工具,為 NVIDIA Spectrum Ethernet 平臺提供可操作的可見性。它將高級遙測技術與用戶界面相結合,使網絡工作流程更易于故障排除和自動化,同時減少維護和停機時間。
我們最近發布了 NetQ 4.2.0 ,其中包括:
- 簡化的事件管理
- 增強的流量遙測分析
- 新 RoCE 驗證
- 新增 DPU 監控
有關新功能和增強功能的更多信息,請參閱 NetQ 4.2.0 用戶指南 。
簡化的事件管理
通過 NetQ 4.2 ,我們簡化了通過接口傳遞網絡事件的方式。事件的嚴重性各不相同。一些事件是網絡警報,可能需要進一步調查,而其他事件是信息性通知,可能不需要干預。在此版本之前, NetQ 將報警和信息事件顯示為兩個單獨的卡。 NetQ 4.2 版本將兩個卡合并為一個卡,擴展后,該卡將顯示一個儀表板,以幫助您快速可視化所有網絡事件。

儀表板顯示事件的時間線,以及導致大多數事件的開關。您可以按類型篩選事件,包括接口、網絡服務、系統和閾值交叉事件。
承認事件有助于你關注需要你關注的活動事件。從儀表板中,還可以創建規則以抑制事件。此功能還可幫助您關注活動事件,從而使已知問題或錯誤警報的顯示方式與錯誤顯示方式不同。
增強的流量遙測分析
NetQ 4.1.0 為 Cumulus Linux 5 引入了 結構范圍內的網絡延遲和緩沖區占用分析 。 x 數據中心結構。現在, NetQ 4.2 支持混合結構(使用 Cumulus Linux 5 )中的部分路徑流遙測分析。 x 交換機與其他交換機(包括非 Cumulus Linux 5.x 和第三方交換機)結合使用。 Cumulus Linux 5 。路徑中的 x 設備顯示流統計信息,例如延遲和緩沖區占用率。不受支持的設備在流量分析中表示為帶紅色 X 的黑條,并且設備不顯示流量統計信息。

此外, NetQ 4.2 流量遙測分析顯示了所分析流量的上下文“剛剛發生的事情”( WJH )事件和下降。帶有 WJH 事件的交換機在流分析圖中表示為紅色條紋條。將鼠標懸停在帶有紅色條的設備上,會顯示 WJH 事件摘要。

新 RoCE 驗證
通過聚合以太網使用 RDMA ( RoCE ),您可以通過以太網使用遠程直接內存訪問( RDMA )而不是使用主機 CPU 來寫入計算或存儲元素。 NetQ 4.0.0 引入了 RoCE 配置和計數器,包括設置各種 RoCE 閾值交叉警報( TCA )的能力。
使用 NetQ 4.2.0 , RoCE 驗證檢查:
- 交換機間有損或無損模式配置的一致性
- DSCP 、服務池、端口組和流量類設置的一致性
- ECN 閾值設置的一致性
- 無損模式 PFC 配置的一致性
- 增強型變速箱選擇設置的一致性
您可以安排 RoCE 驗證定期或按需運行。
新增 DPU 監控
NVIDIA BlueField 數據處理器 ( DPU )通過卸載、加速和隔離廣泛的高級網絡、存儲和安全服務,為任何工作負載提供安全、加速的基礎架構。
NetQ 幫助您監控網絡上的 DPU 庫存。您可以監視 DPU 操作系統、 ASIC 、 CPU 型號、磁盤和內存信息,以幫助管理升級、法規遵從性和其他規劃任務。 使用 NetQ ,您可以查看和監視鍵 DPU 屬性,包括已安裝的軟件包以及 CPU 、磁盤和內存利用率。

在本文中,您已經看到了 NetQ 4.2.0 提供的一些新功能的概述。有關更多信息,請參閱 NetQ 4.2.0 用戶指南 ,并使用 NVIDIA Air 瀏覽 NetQ 。
?