Networking – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Thu, 13 Apr 2023 08:13:28 +0000
zh-CN
hourly
1
196178272 -
通過 AI 的全棧優化在 MLPerf 推理 v3.0 中創下新紀錄
http://www.open-lab.net/zh-cn/blog/setting-new-records-in-mlperf-inference-v3-0-with-full-stack-optimizations-for-ai/
Wed, 05 Apr 2023 03:03:51 +0000
http://www.open-lab.net/zh-cn/blog/?p=6677
Continued]]>
目前最令人興奮的計算應用程序依賴于在復雜的人工智能模型上進行訓練和運行推理,通常是在要求苛刻的實時部署場景中。需要高性能、加速的人工智能平臺來滿足這些應用程序的需求,并提供最佳的用戶體驗 新的人工智能模型不斷被發明,以實現新的功能,而人工智能驅動的應用程序往往依賴于許多這樣的模型協同工作。這意味著人工智能平臺必須能夠運行最廣泛的工作負載,并在所有工作負載上提供優異的性能。MLPerf Inference– 現在, v3.0 的第七版是一套值得信賴的、經過同行評審的標準化推理性能測試,代表了許多這樣的人工智能模型。 人工智能應用程序無處不在,從最大的超大規模數據中心到緊湊的邊緣設備。 MLPerf 推理同時代表數據中心和邊緣環境。它還代表了一系列真實世界的場景,如離線(批處理)處理、延遲受限的服務器、單流和多流場景。
Source
]]>
6677
-
利用 GroovyWaiter 大規模開發和保護 Jenkins 實例
http://www.open-lab.net/zh-cn/blog/exploiting-and-securing-jenkins-instances-at-scale-with-groovywaiter/
Tue, 24 Jan 2023 07:55:23 +0000
http://www.open-lab.net/zh-cn/blog/?p=6138
Continued]]>
Jenkins CI / CD 解決方案為開發人員提供了一種創建自動化、可擴展和高度可配置的管道的方法,以確保代碼庫保持最新,并且可以毫不費力地推出。當開發人員向任何代碼推送新的提交時, Jenkins 都可以接受這些更改,并運行一系列測試和構建,然后通過一條無縫管道將其交付生產。 詹金斯在全球擁有超過 30 萬臺裝置,并在穩步增長。任何一家擁有軟件開發團隊的公司都可能有一個或多個 Jenkins 的實例與之交互。 由于這種普遍性, Jenkins 經常成為威脅行為者的目標,特別是暗示這些管道包含秘密和公司最密切的軟件來源。 GroovyWaiter 是一個簡單的 Python 腳本,它將獲取一個 URL 文件,對于每個 URL ,它將嘗試枚舉對 Jenkins 腳本控制臺的未經驗證的訪問(下面將進一步解釋)。如果它能夠訪問 Console ,
Source
]]>
6138
-
使用 Microsoft Azure Stack HCI 和 NVIDIA BlueField DPU 加速企業應用程序
http://www.open-lab.net/zh-cn/blog/accelerate-enterprise-apps-with-microsoft-azure-stack-hci-and-nvidia-bluefield-dpus/
Thu, 10 Nov 2022 07:09:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=5678
Continued]]>
隨著企業不斷將工作負載轉移到云,一些應用程序需要留在本地,以最大限度地提高延遲性能,并滿足安全性、數據主權和法規遵從性策略。 Microsoft Azure Stack HCI 是作為 Azure 服務提供的超融合基礎架構( HCI )堆棧。 Azure Stack HCI 提供內置的安全性和可管理性,非常適合在核心和邊緣數據中心運行生產工作負載和云原生應用程序。 NVIDIA BlueField data processing unit ( DPU )是一個加速的數據中心基礎設施平臺,可釋放應用程序性能和系統效率。 BlueField DPU 幫助有云思想的企業克服現代 IT 環境中的性能和可擴展性瓶頸。這是通過卸載、加速和隔離軟件定義的基礎架構工作負載來實現的。 標志著性能和生產力的重大飛躍,微軟展示了在 NVIDIA BlueField-2 DPU 上加速的 Azure…
Source
]]>
5678
-
使用最新版本的 NVIDIA NetQ 自動化網絡監控并減少停機時間
http://www.open-lab.net/zh-cn/blog/automate-network-monitoring-and-reduce-downtime-with-the-latest-release-of-nvidia-netq/
Wed, 01 Jun 2022 02:57:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=4251
Continued]]>
NVIDIA NetQ 是一種高度可擴展的現代網絡操作工具,為 NVIDIA Spectrum Ethernet 平臺提供可操作的可見性。它將高級遙測技術與用戶界面相結合,使網絡工作流程更易于故障排除和自動化,同時減少維護和停機時間。 我們最近發布了 NetQ 4.2.0 ,其中包括: 有關新功能和增強功能的更多信息,請參閱 NetQ 4.2.0 用戶指南 。 通過 NetQ 4.2 ,我們簡化了通過接口傳遞網絡事件的方式。事件的嚴重性各不相同。一些事件是網絡警報,可能需要進一步調查,而其他事件是信息性通知,可能不需要干預。在此版本之前, NetQ 將報警和信息事件顯示為兩個單獨的卡。 NetQ 4.2 版本將兩個卡合并為一個卡,擴展后,該卡將顯示一個儀表板,以幫助您快速可視化所有網絡事件。 儀表板顯示事件的時間線,以及導致大多數事件的開關。
Source
]]>
4251
-
為什么沒有理想的數據中心網絡設計
http://www.open-lab.net/zh-cn/blog/why-there-is-no-ideal-data-center-network-design/
Wed, 20 Apr 2022 06:36:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=3757
Continued]]>
網絡管理員的工作很辛苦。他們負責確保網絡上所有用戶、服務器和應用程序的連通性。他們的任務通常是在獲得應用程序需求之前構建網絡設計,這使得一個具有挑戰性的項目更加困難。在這些場景中,網絡管理員嘗試找到一種理想的網絡設計是合乎邏輯的,他們可以將其用于任何一組應用程序。 沒有一種“一刀切”的網絡解決方案每次都能奏效,每種設計都有優缺點。在本文中,我們分析了三種可以被視為理想的網絡類型。然后,我們根據現實世界的因素,描述每種方法的不足之處。 候選人包括: 準備好的讓我們開始吧。 許多具有前瞻性思維的架構師認為純第 3 層( L3 )是理想的設計,因為它簡單且只依賴于一個協議棧。所有流量都在 L3 級別使用同等成本的多路徑路由和平衡,端點冗余通過本機功能的選播地址解決方案實現。它既簡單又優雅。 許多大型網絡規模的 IT 公司選擇它是因為其卓越的運營效率。
Source
]]>
3757
-
通過 NVIDIA AIR 上的 Digital Twins 實現網絡自動化效率的最大化
http://www.open-lab.net/zh-cn/blog/maximize-network-automation-efficiency-with-digital-twins/
Fri, 07 Jan 2022 07:47:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2747
Continued]]>
自動化是提高運營效率和降低運營成本的關鍵,但它不能保證數據中心部署的成功。雖然自動化可以確認配置完整性并防止重復更改中的人為錯誤,但它無法驗證意圖和網絡需求。因此,自動化必須在部署前測試和驗證,而NVIDIA 的方式是用 數據中心數字孿生。 。 數據中心數字雙網絡是物理網絡環境的 1:1 模擬,每個交換機、服務器和電纜都有邏輯實例。這使它能夠用于驗證路由( BGP 、 EVPN )、安全策略遵從性、自動化、監控工具和升級過程。 這個數字孿生托管在云中,使團隊能夠在不增加物理基礎設施開銷的情況下大規模測試其配置。數據中心數字孿生提供了許多好處: NVIDIA Air 是創建網絡數字孿生的免費平臺。這些數字雙胞胎可以是現有拓撲、預構建拓撲的克隆,也可以是定制設計的網絡,可以擴展到 1000 臺交換機和服務器。
Source
]]>
2747
-
NVIDIA DPU Hackathon 推出人工智能、云計算和加速計算突破
http://www.open-lab.net/zh-cn/blog/nvidia-dpu-hackathon-unveils-ai-cloud-and-accelerated-computing-breakthroughs/
Wed, 15 Dec 2021 06:52:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2661
Continued]]>
最新的 NVIDIA DPU Hackathon 匯集了 11 支團隊,旨在創造新的令人興奮的數據處理器( DPU )創新。在 12 月 8 日至 9 日的 24 小時內, NVIDIA DPU 全球黑客大會系列中的第二屆收到了來自各大學和企業的 50 多份團隊申請。 作為一種新型的可編程處理器, DPU 為現代數據中心帶來了前所未有的創新。通過卸載、加速和隔離廣泛的高級網絡、存儲和安全服務, NVIDIA BlueField DPU 為任何環境中的任何工作負載提供了一個安全、加速的基礎架構。NVIDIA DOCA 軟件框架將 API 、驅動程序、庫、示例代碼、文檔、服務和預打包容器集合在一起,這樣開發人員可以加快 BlueField DPU 上的應用程序開發和部署。它們跨越多個用例,包括安全、自動化、 AI 、 HPC 和遙測。 “我們熱愛 hackathons ,
Source
]]>
2661
-
利用 NVIDIA Air 市場帶來網絡化
http://www.open-lab.net/zh-cn/blog/bringing-networking-into-view-with-the-air-marketplace/
Wed, 15 Dec 2021 06:48:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2654
Continued]]>
網絡模擬是必不可少的,因為基于 CLI 和冒險的基于復制/粘貼的配置的經典部署模型在中大規模環境中已變得效率低下。 NVIDIA Air 提供了一個平臺,用于構建、模擬和體驗由現代網絡操作系統( NOS )驅動的現代數據中心。 NVIDIA Air 是一個基于云的環境,在瀏覽器中運行,后端由 NVIDIA Cumulus Linux 、 SONiC 和 Linux (即標準服務器 Linux )提供支持。這種網絡模擬方法顯示了從傳統網絡到本地云新領域的范式轉變。 Air 的設計目的是消除對 hypervisor 的需求, hypervisor 對于快速功能測試來說常常是資源瓶頸和耗時限制。 Air 解決了許多情況: Air 為網絡團隊提供了一個始終可訪問、始終在線的培訓或試生產環境。企業現在可以縮小硬件占地面積,減少開支;由于硬件需求減少,資本支出降低;
Source
]]>
2654
-
通過免費的入門課程開始使用 DPU 的 DOCA
http://www.open-lab.net/zh-cn/blog/free-dli-course-introduction-to-doca-for-dpus/
Tue, 07 Dec 2021 03:49:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2608
Continued]]>
繼在今年的 GTC 上宣布 搶先體驗 NVIDIA DOCA 軟件框架之后,,我們推出了一個自定進度的 DOCA 課程,幫助您開始使用這個新框架。 NVIDIA 深度學習學院( DLI ) 提供免費的自定進度課程,名為 DPU 的 DOCA 簡介 “在這門 2 小時的入門課程中,您將了解 DOCA 和 DPU 如何幫助開發加速數據中心服務的應用程序。本次備受期待的培訓涵蓋了 DOCA 平臺的基本要素。 在過去的十年中,計算已經突破了個人電腦和服務器的局限,進入了超規模的數據中心。隨著這一范式的轉變,數據處理器( DPU )應運而生,這是一類新的可編程處理器,將 CPU 和 GPU 合并為計算的三大支柱之一。 DPU 旨在從 CPU 上卸載所有虛擬數據中心,如網絡、安全和存儲工作負載。通過這樣做,它們有意義地減少了服務器 CPU 專注于其主要應用程序工作負載的開銷。
Source
]]>
2608
-
通過網絡數字孿生引領全球供應鏈
http://www.open-lab.net/zh-cn/blog/navigating-the-global-supply-chain-with-networking-digital-twins/
Mon, 06 Dec 2021 06:17:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2550
Continued]]>
以太網交換機、跑車、家用電器和衛生紙有什么共同點?如果你讀了這篇博客的標題,并且經歷了過去一年半,你可能知道答案。這些產品的可用性都受到全球大流行造成的材料短缺的影響。 在某些情況下,供應問題更像是一種不便——再多等幾個月才能得到那輛新的克爾維特不會是世界末日。對于其他產品(比如廁紙或替代冰箱),供應短缺過去是,現在也是一個大問題。 這對消費者的影響顯而易見,但企業也感受到了交付周期過長的痛苦。考慮以太網交換機:以太網交換機構建將數據中心聯系在一起的網絡結構。以太網交換機短缺不僅僅意味著“機架 A 無法與機架 B 通信”。它們意味著總吞吐量降低,現有基礎設施上的負載增加,導致更多停機和計劃外停機;也就是說,對業務成果產生重大不利影響。 這聽起來很糟糕,但沒有必要驚慌。 你可以通過 NVIDIA Air 的數據中心數字孿生幫助您緩解這些挑戰,并轉變您的運營。 那么,
Source
]]>
2550
-
NVIDIA BlueField DPU 生態系統隨著合作伙伴推出聯合解決方案而擴展
http://www.open-lab.net/zh-cn/blog/nvidia-bluefield-dpu-ecosystem-expands-as-partners-introduce-joint-solutions/
Mon, 29 Nov 2021 04:56:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2479
Continued]]>
英偉達最近推出了 NVIDIA DOCA 1.2 軟件框架 對于 英偉達 BlueField DPU ,世界上最先進的數據處理器( DPU )。此最新版本建立在 DOCA 早期訪問計劃 使合作伙伴和客戶能夠加快 DPU 上應用程序和整體零信任解決方案的開發。 NVIDIA 正與領先的平臺供應商和合作伙伴合作,整合并擴展 DOCA 對 NVIDIA BlueField DPU 上商業發行版的支持。了解這些行業領先者如何開始使用 DPU / DOCA 體系結構集成其解決方案,因為關鍵合作伙伴在最近的 NVIDIA GTC 上展示了這些解決方案。 Red Hat – “ 利 NVIDIA Morpheus 人工智能框架檢測敏感信息 “ 紅帽和英偉達一直致力于將 NVIDIA Morpheus AI 應用框架的安全分析能力引入網絡安全開發者的紅帽基礎架構平臺。這篇文章提供了一組配置指令,
Source
]]>
2479
-
使用 NVIDIA Linux 交換機制作新的網絡模型
http://www.open-lab.net/zh-cn/blog/cooking-up-new-network-models-with-linux-switch/
Wed, 10 Nov 2021 06:39:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2306
Continued]]>
想象一下:你正在一家高檔餐廳吃飯。你看了看菜單,決定想吃菲力牛排。你點的牛排要半生的。服務員把它拿出來,鍍得很漂亮,服務也很好。然而,你聽到一個小小的聲音在你的腦后。“我本來可以在我自己的廚房里完全按照我定義的半生不熟來準備這塊牛排的!” 我們都有這樣的感覺:為了獲得完美的結果,有時候你必須自己投入一些工作。 Yandex 認識到了這一點,因此他們與 NVIDIA 合作,在 NVIDIA 頻譜以太網交換機上使用 NVIDIA Linux 交換機。 NVIDIA 的獨特定位是,在 Yandex 等開拓者發展開放網絡生態系統的同時,為他們提供支持。 Yandex 是一家俄羅斯互聯網公司。你可以把 Yandex 描述為一個搜索引擎,很像谷歌,但他們不僅僅是搜索。 Yandex 為用戶提供多種服務:音樂和電影流媒體、翻譯、智能個人助理等等。 正如 Yandex 網絡主管安東·
Source
]]>
2306
-
NVIDIA 將 BlueField DPU 引入 DOCA 1.2 ,作為零信任安全平臺
http://www.open-lab.net/zh-cn/blog/nvidia-introduces-bluefield-dpu-as-a-platform-for-zero-trust-security-with-doca-1-2/
Tue, 09 Nov 2021 10:15:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2205
Continued]]>
今天, NVIDIA 推出了用于NVIDIA BlueField® DPU的NVIDIA DOCA 1.2 software,這是世界上最先進的數據處理器( DPU )。此最新版本定于 11 月底發布,以DOCA early access program的勢頭為基礎,使合作伙伴和客戶能夠加快 DPU 上應用程序和整體零信任解決方案的開發。新的認證、認證、隔離和監視功能使得 BlueField 成為零信任分布式安全平臺的理想基礎。 以前,外圍安全足以保護數據中心免受外部威脅,因為數據中心內的用戶、設備、數據和應用程序都是隱式受信任的。但有了云,軟件即服務的私有云,您可以將自己的設備( BYOD )和下載大量應用程序的用戶帶入數據中心,這種默示的信任不再被擔保或接受。因此,零信任模型認識到,數據中心內部的資源不可能比外部的資源更受信任。零信任首先假設所有用戶、設備、應用程序和數據,
Source
]]>
2205
-
NVIDIA AI-on-5G 企業版: AI 和 5G 在邊緣的融合平臺
http://www.open-lab.net/zh-cn/blog/nvidia-ai-on-5g-for-enterprise-a-converged-platform-for-ai-and-5g-at-the-edge/
Tue, 09 Nov 2021 08:46:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2166
Continued]]>
通過 5G 連接結構在 edge 部署 AI 應用程序是推動企業運營數字化轉型的重要一步。人工智能正在重塑各個行業部門的企業開展業務的方式。 5G 提供超高速、廣域、安全、低延遲和超可靠的連接,使企業能夠連接其人工智能系統,無論是在本地、現場還是在云中。這兩股力量將共同推動工業部門的革命,并在企業市場創造價值。 IHS Market 預計,到 2035 年,支持 5G 的價值鏈將產生 13 . 1 萬億美元的總經濟產出。 通常, 5G 和邊緣 AI 基礎設施分別進行評估、設計、采購、部署和管理。筒倉式方法本質上是低效的,因為 AI 和 5G 運行在同一平臺可以提供的計算能力上。 英偉達AI-on-5G platform在單個計算平臺上提供企業 5G 網絡和相關企業 AI 應用。它是市場上第一款以端到端、全面協調的方式實現這一目標的產品。 通過將 AI 和 5G…
Source
]]>
2166
-
使用 NetQ 排除網絡故障
http://www.open-lab.net/zh-cn/blog/troubleshooting-networks-with-netq/
Tue, 19 Oct 2021 07:37:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2060
Continued]]>
EVPN已成為現代數據中心架構的標準解決方案。對于終端用戶來說,受益于基于BGP的控制平面所具有的穩定性,EVPN提供了擴展其廣播域的靈活性。但這些增加的益處是以提高配置的復雜性為代價的。 當前所面對的不再是相對固定、簡單,可以通過維護人員直觀分析來發現錯誤的網絡配置。真正的生產性EVPN配置可能包括多個深度嵌套結構,而且隨網絡中的租戶數量成比例增長。 EVPN配置復雜性可以且必須通過適當的自動化解決方案予以解決,這可以減少人為出錯的可能性,而NVIDIA Cumulus Linux正是解決該問題的合適解決方案。但僅有自動化還不夠,錯誤仍然可以通過數據源引入系統,例如配置管理數據庫(CMDB)的人為錯誤。 這就是為什么對于任何具有合理復雜程度的基礎設施,用戶應該有辦法來采集各類日志、指標,并且調試、輸出、匯總、關聯和處理這些信息,從而嘗試推斷系統的內部狀態。
Source
]]>
2060
人人超碰97caoporen国产