數據中心/云基礎設施 – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Thu, 26 Oct 2023 06:02:01 +0000 zh-CN hourly 1 196178272 使用 Spark RAPID ML 庫中的新算法降低 Apache Spark ML 計算成本 http://www.open-lab.net/zh-cn/blog/reduce-apache-spark-ml-compute-costs-with-new-algorithms-in-spark-rapids-ml-library/ Tue, 24 Oct 2023 05:47:26 +0000 http://www.open-lab.net/zh-cn/blog/?p=8047 Continued]]> Spark RAPID ML 是一個開源 Python 包,它可以使 NVIDIA GPU 加速 PySpark MLlib。它提供了與 PySpark MLlib DataFrame API 兼容,并在使用支持的算法進行訓練時加速。想要了解更多信息,請查看 新的 GPU 庫降低 Apache Spark ML 的計算成本。 PySpark MLlib DataFrame API 的兼容性意味著它可以更容易地融入現有的 PySpark ML 應用程序,最多只需更改包導入。K-means 算法如下所示。更改包導入是使用此庫啟用 GPU 加速所需的唯一額外步驟。 在 GPU 加速的 Databricks 的 AWS 托管 Spark 服務上,在三節點 Spark 集群中運行的基準測試套件中使用支持的算法進行培訓,

Source

]]>
8047
通過加速計算和 NVIDIA Aerial 開創 5G OpenRAN 進步 http://www.open-lab.net/zh-cn/blog/pioneering-5g-openran-advancements-with-accelerated-computing-and-nvidia-aerial/ Tue, 29 Aug 2023 05:02:27 +0000 http://www.open-lab.net/zh-cn/blog/?p=7707 Continued]]> NVIDIA 憑借其與 OpenRAN 兼容的 5G 產品組合,正在推動整個生態系統中 5G 軟件和硬件的快節奏創新。加速計算硬件和 NVIDIA Aerial 5G 軟件正在為電信公司、云服務提供商(CSP)、企業和學術研究人員等關鍵行業利益相關者提供解決方案。 TMC 最近將 NVIDIA MGX、NVIDIA Grace Hopper Superchip(GH200) 以及 NVIDIA Aerial Research Cloud 評為 2023 INTERNET TELEPHONY Open RAN Products of the Year。該獎項“表彰和表彰那些最具創新性和顛覆性的開放式 RAN 產品和解決方案,它們不僅為行業的增長和發展做出了貢獻,而且取得了積極成果。” 該獎項展示了 NVIDIA 5G 生態系統的深化能力,

Source

]]>
7707
使用 NVIDIA Spectrum 以太網最大限度地提高存儲網絡性能 http://www.open-lab.net/zh-cn/blog/maximizing-network-performance-for-storage-with-nvidia-spectrum-ethernet/ Mon, 26 Jun 2023 06:25:30 +0000 http://www.open-lab.net/zh-cn/blog/?p=7272 Continued]]> 隨著數據生成的不斷增加,線性性能擴展已成為擴展存儲的絕對要求。存儲網絡就像汽車道路系統:如果道路不是為速度而建的,那么汽車的潛在速度也無關緊要。即使是法拉利在充滿障礙的未鋪路面的土路上也很慢。 擴展存儲性能可能會受到連接存儲節點的以太網結構的阻礙。 NVIDIA 加速以太網可以消除性能瓶頸,為一般應用程序,特別是 AI / ML 實現最大的存儲性能。 全球每秒有 54000 張照片被拍攝。當你讀到這篇文章的時候,這個數字會更高。無論您的業務是什么,您都有可能擁有大量必須存儲和分析的數據,而且數據量每天都在增長。 使用越來越大的存儲文件管理器的舊的按比例擴展方法已被一種按比例擴展的方法所取代,這種方法可以提供容量和性能都呈線性擴展的存儲。 使用擴展存儲或分布式存儲,可以將幾個較小的節點配置和連接為一個邏輯單元。單個文件或對象可以分布在多個節點上。

Source

]]>
7272
為網絡管理員導航生成式人工智能 http://www.open-lab.net/zh-cn/blog/navigating-generative-ai-for-network-admins/ Thu, 25 May 2023 06:33:54 +0000 http://www.open-lab.net/zh-cn/blog/?p=7130 Continued]]> 我們都知道人工智能正在改變世界。對于網絡管理員來說,人工智能可以以一些驚人的方式改善日常運營: 然而,人工智能無法取代經驗豐富的網絡管理員的專業知識。人工智能旨在增強你的能力,就像一個虛擬助理。因此,人工智能可能會成為你最好的朋友,但生成型人工智能也是一種新的數據中心工作負載,它帶來了新的范式轉變: NVIDIA 集體通信庫( NCCL )。 網絡管理員不得不處理許多其他最近的更改: 不久前,我們可能已經通過特定網絡命令行界面( CLI )的專業水平來衡量新網絡管理員的價值。隨著混合云計算和 DevOps 的出現,從 CLI 到 API 的轉變越來越大。 Ansible 、 SALT 和 Python 方面的技能現在比 Cisco 認證更有價值。 甚至您監控和管理網絡的方式也發生了變化。您已經從使用 SNMP 和 NetFlow…

Source

]]>
7130
使用 NVIDIA Cumulus Linux 實現數據中心網絡自動化 http://www.open-lab.net/zh-cn/blog/automating-data-center-networks-with-nvidia-cumulus-linux/ Tue, 09 May 2023 02:38:15 +0000 http://www.open-lab.net/zh-cn/blog/?p=6908 Continued]]> 隨著數據中心的發展和不斷增長,基本保持不變的簡單網絡時代已經一去不復返了。當時,當需要更改配置時,網絡管理員只需逐行按設備進行更改即可。 隨著數據中心從物理內部部署發展到數字化云基礎設施,傳統網絡也在發展。他們需要根據業務需求進行增長。這增加了網絡運營團隊管理、維護和不斷適應復雜而精確配置不斷變化的環境的負擔。 為了克服手動管理網絡運營帶來的限制,數據中心必須實現自動化,使其更加敏捷。 數據中心自動化釋放了人類的計算時間,但也有以下好處: EMA 關于Future of Data Center Network Automation聲明稱,技術組織相信數據中心網絡自動化可以提高運營效率、降低安全風險,并提高合規性和數字化靈活性。 NVIDIA Cumulus Linux通過在一種統一的語言 Linux 上進行標準化,提供了與任何標準自動化工具的完全集成。

Source

]]>
6908
使用 VMware vSphere 8 和 NVIDIA BlueField DPU 加速 Redis 性能 http://www.open-lab.net/zh-cn/blog/accelerating-redis-performance-using-vmware-vsphere-8-and-nvidia-bluefield-dpus/ Fri, 05 May 2023 03:24:40 +0000 http://www.open-lab.net/zh-cn/blog/?p=6920 Continued]]> 向現代分布式工作負載的轉變,以及更高的網絡速度,增加了基礎設施服務的開銷。為企業提供動力的應用程序可用的 CPU 周期較少。部署數據處理器( DPU )來卸載和加速這些基礎設施服務可以提供更快的性能、更低的 CPU 利用率和更好的能源效率。 許多現代工作負載是分布式的,這意味著它們不再只適用于一臺服務器。相反,它們在多個服務器上同時運行,以實現更大的可擴展性和可用性。此類工作負載包括網絡和電子商務應用程序,如 NoSQL 數據庫、分析、人工智能和 Redis 等關鍵價值商店。 許多公司在 vSphere 企業工作負載平臺上運行這些分布式工作負載。隨著應用程序的不同部分在虛擬機和主機之間進行通信, vSphere 必須投入越來越多的 CPU 功率來管理數據移動和網絡等基礎架構工作負載。 在 CPU 和 DPU 上運行網絡和安全基礎設施服務,

Source

]]>
6920
使用 NVIDIA WJH 更快地診斷網絡問題 http://www.open-lab.net/zh-cn/blog/diagnosing-network-issues-faster-with-wjh/ Thu, 04 May 2023 03:49:59 +0000 http://www.open-lab.net/zh-cn/blog/?p=6936 Continued]]> 人工智能已經無縫地融入了我們的生活,并以幾年前我們甚至無法想象的方式改變了我們。在過去,對人工智能的感知是一種未來主義和復雜的東西。只有大公司在其擁有 HPC 技術的超級計算機上使用人工智能來預測天氣,并在醫療保健和科學領域取得突破性發現。 如今,由于 GPU 、 CPU 、高速存儲和人工智能優化的軟件創新,每個人都可以訪問人工智能。您甚至可以將人工智能作為服務( SaaS )或基礎設施( IaaS )部署在云中。 我們見證了人工智能在每個行業的廣泛應用:醫療保健和金融、自動駕駛汽車、廣告推薦,以及最近創建和編輯視頻、圖像和音樂等內容的生成人工智能。隨著最近推出的 ChatGPT-4 ,它使用大型語言模型( LLM )來理解、響應,甚至像人類一樣生成文本,思考我們可以實現的無限潛力是令人興奮的。 充分利用您的人工智能需要的不僅僅是昂貴的高端 GPU 和存儲系統。

Source

]]>
6936
使用 NVIDIA BlueField DPU 加速 Suricata IDS / IPS http://www.open-lab.net/zh-cn/blog/accelerating-the-suricata-ids-ips-with-nvidia-bluefield-dpus/ Thu, 04 May 2023 03:41:44 +0000 http://www.open-lab.net/zh-cn/blog/?p=6930 Continued]]> 深度數據包檢測( DPI )是網絡安全的一項關鍵技術,能夠在數據包在網絡中傳輸時對其進行檢測和分析。通過檢查這些數據包的內容, DPI 可以識別潛在的安全威脅,如惡意軟件、病毒和惡意流量,并防止它們滲透到網絡中。然而, DPI 的實現也帶來了對網絡性能的顯著影響。 使用 NVIDIA BlueField DPU 降低了執行深度數據包檢查的成本和性能影響。 Suricata 是一款高性能、開源的網絡分析和威脅檢測應用程序,由私人和公共組織使用,并由主要供應商嵌入以保護資產。使用 Suricata (或任何其他入侵檢測系統和入侵保護系統( IDS / IPS )解決方案)檢查高通量流量需要高 CPU 使用率。因此, CPU 可用性可能會成為一個瓶頸。 數據中心的流量檢查可以是集中式的,也可以是分布式的: 每種方法都有其優點和缺點。分布式檢查更為復雜,

Source

]]>
6930
人人超碰97caoporen国产