• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 3 月 19 日下午 2 點,鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看
    數據中心/云端

    AI-RAN 上線,為電信公司帶來新的 AI 機遇

    AI 正在以新的方式改變行業、企業和消費者體驗。生成式 AI 模型正在轉向推理, 代理 AI 正在實現新的成果導向型工作流,而 物理 AI 則使攝像頭、機器人、無人機和汽車等終端能夠實時做出決策并進行交互。

    所有這些用例的共同點是,需要普遍、可靠、安全和超快的連接。

    電信網絡必須為這種新型 AI 流量做好準備,此類流量可以直接通過前向回傳無線接入網,也可以從公有云或私有云作為由企業應用生成的完全獨立的 AI 推理流量進行回傳。

    本地無線基礎設施提供了處理 AI 推理的理想場所。這是一種新的電信網絡方法,即 AI-RAN

    基于傳統 CPU 或 ASIC 的 RAN 系統專為 RAN 使用而設計,目前無法處理 AI 流量。AI-RAN 支持基于 GPU 的共同基礎設施,可同時運行無線和 AI 工作負載,從而將網絡從單一用途的基礎設施轉變為多用途的基礎設施,并將站點從成本中心轉變為收入來源。

    通過對合適技術的戰略投資,電信公司可以飛躍發展成為 AI 電網,促進各行各業、消費者和企業中 AI 的創建、分發和使用。這一時刻為電信公司帶來了巨大的機會,可以通過重新利用其中央和分布式基礎設施來構建用于 AI 訓練(創建)和 AI 推理(分發)的網絡。

    SoftBank 和 NVIDIA 快速推進 AI-RAN 商業化

    SoftBank 已將 AI-RAN 愿景變為現實,在日本神奈川縣藤沢市成功進行了 戶外野外試驗 ,并以 NVIDIA 加速硬件和 NVIDIA Aerial 軟件為技術基礎。

    這一成就標志著 AI-RAN 商業化向前邁出了多步,并為行業對技術可行性、性能和貨幣化的要求提供了真實的證據:

    • 全球首個戶外 5G AI-RAN 現場試驗,在 NVIDIA 加速計算平臺上運行。這是一種端到端解決方案,基于與 5G 核心集成的全棧虛擬 5G RAN 軟件。
    • 實現電信級虛擬 RAN 性能。
    • 實現 AI 和 RAN 多租戶和編排。
    • 與現有基準相比,驗證了能效和經濟效益。
    • 一種新的解決方案,用于解鎖集成在人工智能無線接入網絡(AI-RAN)基礎設施上的人工智能市場。
    • 展示了在 AI-RAN 網絡上運行的真實 AI 應用。

    最重要的是,SoftBank 的目標是在 2026 年商用發布自己的 AI-RAN 產品,以便在全球部署。

    為了幫助其他移動網絡運營商立即開始其 AI-RAN 之旅,SoftBank 還計劃提供一個參考套件,其中包括快速輕松地試用 AI-RAN 所需的硬件和軟件元素。

    端到端 AI-RAN 解決方案和現場結果?

    SoftBank 通過集成 NVIDIA 和生態系統合作伙伴的硬件和軟件組件,并對其進行強化以滿足電信級要求,開發了自己的 AI-RAN 解決方案。該解決方案共同實現了 100% 軟件定義的完整 5G vRAN 堆棧,在 NVIDIA GH200(CPU+GPU)、NVIDIA Bluefield-3(NIC/DPU)和 Spectrum-X 上運行,用于前傳和回傳網絡。它集成了 20 個無線電單元和一個 5G 核心網絡,并連接 100 個移動 UE。

    核心軟件堆棧包括以下組件:

    • SoftBank 使用 NVIDIA Aerial CUDA 加速的 RAN 庫開發和優化了 5G RAN 第一層功能,例如信道映射、信道估計、調制和前向糾錯。
    • 適用于 L2 函數的 Fujitsu 軟件
    • Red Hat 的 OpenShift 容器平臺 (OCP) 作為容器虛擬化層,使不同類型的應用程序能夠在同一底層 GPU 計算基礎設施上運行。
    • 軟銀開發的 E2E AI 和 RAN 編排器,可根據需求和可用容量無縫地提供 RAN 和 AI 工作負載

    底層硬件是 NVIDIA GH200 Grace Hopper 超級芯片,可用于從分布式到集中式 RAN 場景的各種配置。此實現使用單個機架中的多個 GH200 服務器,同時為聚合 RAN 場景中的人工智能和 RAN 工作負載提供服務。這相當于部署多個傳統 RAN 基站。

    在此試點中,當在僅使用 RAN 的模式下使用時,每個 GH200 服務器能夠使用 100MHz 帶寬處理 20 個 5G 單元。在理想條件下,每個單元實現了 1.3Gbps 的峰值下行鏈路性能,并在戶外部署中展示了 816Mbps 的商用級可用性。

    實現 AI-RAN 多租戶?

    AI-RAN 技術的首要原則之一是能夠同時運行 RAN 和 AI 工作負載,而不會損害運營商級別的性能。這種多租戶可以是時間也可以是空間:根據一天中的時間或計算百分比來劃分資源。這也意味著需要一個編排器,能夠根據可用容量無縫地調配、取消調配或轉移工作負載。

    在富士川市的試驗中,在 RAN 和 AI 工作負載之間進行靜態資源分配的基礎上,GH200 成功地演示了并發的 AI 和 RAN 處理(圖 1)。

    A screenshot of SoftBank’s dashboard shows cluster GPU utilization at up to 100% with AI-RAN c compared to the 30% average utilization of traditional RAN-only.
    圖 1. AI 和 RAN 并發及總 GPU 利用

    每臺 NVIDIA GH200 服務器均由多個 MIG(多實例 GPU)組成,可將單個 GPU 劃分為多個獨立的 GPU 實例。每個實例都有自己的專用資源,如內存、緩存和計算核心,并且可以獨立運行。

    SoftBank 編排器可以智能地分配整個 GPU 或 GPU 內的一些 MIG 來運行 AI,一些用于運行 RAN 工作負載,并在需要時動態切換。此外,還可以為 RAN 和 AI 靜態分配一定比例的計算,例如,60% 用于 RAN,40% 用于 AI,而不是基于需求的分配。

    目標是最大限度地提高容量利用率。借助 AI-RAN,電信公司可以實現近 100%的利用率,而典型的僅使用 RAN 的網絡的利用率僅為 33%。得益于動態編排和優先級策略,在滿足 RAN 負載峰值需求的同時,利用率最高可提升 3 倍。

    打造 AI-RAN 市場?

    分布式 AI-RAN 基礎設施現已具備新的 AI 計算能力,因此出現了如何將 AI 需求引入這種 AI 計算供應的問題。

    為了解決這一問題,軟銀使用了由 NVIDIA AI Enterprise 提供支持的無服務器 API,在 AI-RAN 上部署和管理 AI 工作負載,具有安全性、可擴展性和可靠性。NVIDIA AI Enterprise 無服務器 API 在 AI-RAN 基礎設施上托管,并與軟銀 E2E AI-RAN 編排器集成,可連接到運行相同 API 的任何公有云或私有云,在計算資源可用時,將外部 AI 推理作業發送到 AI-RAN 服務器(圖 2)。

    A diagram shows three kinds of workloads running on an AI-RAN server (RAN, internal AI, and external AI), and how external AI workloads are brought in through the integration of NVIDIA AI Enterprise serverless API.
    圖 2. 與 SoftBank AI-RAN 集成的 AI 市場解決方案

    該解決方案支持 AI 市場,幫助軟銀集團提供本地化、低延遲、安全的推理服務。它還展示了 AI-RAN 在幫助電信公司成為 AI 分布網(尤其是對于外部 AI 推理任務而言)方面的重要性,并開辟了新的收入機會。

    展示 AI-RAN 應用?

    在這次戶外試驗中,展示了軟銀開發的新型邊緣 AI 應用,通過實時 AI-RAN 網絡演示。

    • 通過 5G 遠程支持自動駕駛汽車
    • 工廠多模態 AI 應用
    • 機器人開發應用

    通過 5G 遠程支持自動駕駛汽車?

    社會實施自動駕駛的關鍵需求是車輛安全性和降低運營成本。

    在富士川市的試驗中,SoftBank 演示了一輛自動駕駛汽車,該汽車使用 5G 將其前攝像頭視頻轉發到托管在 AI-RAN 服務器上的基于 AI 的遠程支持服務。多模態 AI 模型分析視頻流,進行風險評估,并使用 5G 文本向自動駕駛汽車發送建議操作。

    這也是可解釋 AI 的一個示例,因為可以通過摘要文本和日志記錄來監控和解釋自動駕駛汽車的所有操作,以獲得遠程支持。

    工廠多模態 AI 應用?

    在此用例中,多模態輸入(包括視頻、音頻和傳感器數據)使用 5G 流式傳輸到 AI-RAN 服務器。多個 LLMs、VLMs、檢索增強生成(RAG)管道和 NVIDIA NIM 微服務托管在 AI-RAN 服務器上,用于合并這些輸入,并通過聊天界面讓使用 5G 的用戶訪問知識。

    這非常適合工廠監控、施工現場檢查以及類似的復雜室內外環境。該用例展示了邊緣 AI-RAN 如何通過保持數據訪問和分析的本地、安全和隱私性(這是大多數企業的強制要求)來實現本地數據主權。

    機器人開發應用?

    SoftBank 展示了邊緣 AI 推理對通過 5G 連接的機器人的優勢。 一個機器人經過訓練,可以根據語音和動作跟蹤人類。

    該演示將機器人在本地 AI-RAN 服務器上托管 AI 推理時的響應時間與在中央云上托管時的響應時間進行了比較,差異顯而易見。基于邊緣的推理機器人狗可即時跟蹤人類的動作,而基于云的推理機器人則難以跟上這一步伐。

    使用 Aerial RAN Computer-1 加速 AI-RAN 商業案例

    雖然業界已經接受了 AI-RAN 的愿景,但 GPU 支持的基礎設施的能效和經濟效益仍然是關鍵要求,特別是與傳統的 CPU 和 ASIC 的 RAN 系統相比的情況。

    通過 AI-RAN 的現場試驗,SoftBank 和 NVIDIA 不僅證明了支持 GPU 的 RAN 系統的可行性和高性能,而且在能效和經濟盈利能力方面也有顯著提高。

    NVIDIA 最近宣布推出基于下一代 NVIDIA Grace Blackwell 超級芯片的 Aerial RAN Computer-1 ,作為推薦的 AI-RAN 部署平臺。我們的目標是將 SoftBank 5G vRAN 軟件從 NVIDIA GH200 遷移到基于 GB200-NVL2 的 NVIDIA Aerial RAN Computer-1,這樣的轉變更容易,因為代碼已經支持 CUDA。

    借助 GB200-NVL2 ,AI-RAN 的可用計算能力將增加 2 倍。與之前的 H100 GPU 系統相比,Llama-3 的 AI 處理能力將提高 5 倍,數據處理的 AI 處理能力將提高 18 倍,向量數據庫搜索的 AI 處理能力將提高 9 倍。

    在本次評估中,我們將基于 GB200 NVL2 的目標部署平臺 Aerial RAN Computer-1 與新一代 x86 和出色的自定義 RAN 產品基準進行了比較,并驗證了以下結果:

    • 加速 AI-RAN 提供最佳的 AI 性能
    • 加速 AI-RAN 是可持續的 RAN
    • 加速的 AI-RAN 利潤豐厚

    加速 AI-RAN 提供最佳的 AI 性

    在 100% AI-only 模式下,每臺 GB200-NVL2 服務器每秒生成 25000 個令牌,相當于每臺服務器每小時 20 美元的可用可盈利計算量,即每臺服務器每月 15,000 美元。

    請記住,目前無線服務的每個用戶平均收入(ARPU)在 5–50 美元/月之間,具體取決于國家/地區,因此 AI-RAN 開辟了價值數十億美元的新 AI 收入機會,比僅使用 RAN 的系統的收入高出幾個數量級。

    使用的令牌 AI 工作負載是 Llama-3-70B FP4,這表明 AI-RAN 已經能夠運行世界上最先進的 LLM 模型。

    加速 AI-RAN 是可持續的 RAN?

    在 100% 僅 RAN 模式下,GB200-NVL2 服務器功耗性能(瓦特/千兆位每秒)表現出以下優勢:

    • 與當今最好的定制 RAN-only 系統相比,功耗降低 40%
    • 與基于 x86 的 vRAN 相比,功耗降低 60%
    • 分布式 RAN 和集中式 RAN 配置的效率相似。

    作為偶數比較,它假設所有平臺上的 100 MHz 4T4R 單元數量和 100% RAN 工作負載相同。

    A vertical bar chart compares the x86, custom, and NVIDIA GB200 NVL2 platforms. The NVIDIA platform delivers 40% less power than the best-in-class traditional RAN platform.
    圖 3.RAN 功耗和性能 (瓦特/千兆比特每秒)

    加速的 AI-RAN 利潤豐厚?

    在本次評估中,我們使用了覆蓋東京一個地區的 600 個單元作為所比較的三個平臺中每個平臺的 RAN 部署的通用基準。然后,我們研究了 AI 和 RAN 工作負載分布的多個場景,從僅使用 RAN 到使用大量 RAN 或使用大量 AI 的場景不等。

    在 AI 密集型場景 (圖 4) 中,我們使用了一種三分之一的 RAN 和三分之二的 AI 工作負載分布:

    • 對于基于 NVIDIA GB200 NVL2 的加速 AI-RAN 基礎設施,每投入 1 美元的資本支出(CapEx),電信公司可在 5 年內創造 5 倍的收入。
    • 從凈利潤的角度來看,考慮到所有資本支出和運營支出成本,總體投資可提供 219% 的利潤空間。這當然是 SoftBank 特有的,因為它使用了當地國家成本假設。
    A vertical bar chart shows new AI revenues and total AI costs for three RAN-only platforms plus RAN-heavy and AI-heavy results. The latter two are much higher, per Table 1.
    圖 4. 覆蓋東京一個地區 600 個基站的 AI-RAN 經濟學
    ? 33%的 AI 和 67%的 RAN 67%的 AI 和 33%的 RAN
    每 1 美元資本支出的收入 2 倍 5 倍
    利潤百分比基于 TCO 33% 219 歐元
    表 1. AI 密集型場景與 RAN 密集型結果對比

    在 RAN 密集型場景中,我們使用了三分之二的 RAN 和三分之一的 AI 工作負載分配,并發現 NVIDIA 加速的 AI-RAN 按資本支出除以的收入是 2 倍,使用 SoftBank 本地成本假設,5 年內利潤率為 33%。

    在僅使用 RAN 的情況下,NVIDIA Aerial RAN Computer-1 比僅使用 RAN 的定制解決方案更具成本效益,這凸顯了使用加速計算進行無線電信號處理的優勢。

    從這些場景中可以明顯看出,與僅使用 RAN 的解決方案相比,AI-RAN 在 AI 密集型和 RAN 密集型模式下都具有很高的盈利能力。事實上,AI-RAN 將傳統的 RAN 從成本中心轉變為盈利中心。

    每臺服務器的盈利能力隨著 AI 使用率的提高而提高。即使在僅使用 RAN 的情況下,AI-RAN 基礎設施也比僅使用 RAN 的自定義選項更具成本效益。

    用于計算收入和 TCO 的主要假設包括:

    • 每個平臺的相應平臺、服務器和機架數量使用在相同頻率 4T4R 上部署 600 個單元的通用基準計算得出。
    • 總擁有成本(TCO)計算周期為 5 年,包括硬件、軟件、vRAN 和 AI 的運營成本。
    • 對于新的 AI 收入計算,我們使用了基于 GB200 NVL2 AI 性能基準的 20 美元/小時/服務器。
    • 運營支出成本基于日本當地的電力成本,不可在全球范圍內擴展。
    • 利潤**(新的 AI 收入 – TCO)/TCO

    這種對 AI 收入提升、能效和盈利能力的驗證讓我們對這項技術的可行性、性能和經濟效益毫不猶豫。

    展望未來,每一代 NVIDIA 超級芯片 (例如 Vera Rubin) 帶來的指數級收益將使這些收益進一步成倍增加,從而實現期待已久的電信網絡業務轉型。

    展望未來?

    SoftBank 和 NVIDIA 將繼續合作 ,實現 AI-RAN 的商業化,并將新的應用帶入生活。下一階段的合作將包括研究 AI-for-RAN 以提高頻譜效率,以及研究 NVIDIA Aerial Omniverse 數字孿生,以在數字世界中模擬準確的物理網絡,從而進行微調和測試。

    NVIDIA AI Aerial 為全球運營商和生態系統合作伙伴利用加速計算和軟件定義的 RAN+AI 的強大功能轉變 5G 和 6G 網絡奠定了基礎。現在,您可以使用 NVIDIA Aerial RAN Computer-1 和 AI Aerial 軟件庫開發自己的 AI-RAN 實現。

    NVIDIA AI Enterprise 還在幫助創建可托管在 AI-RAN 上的新的電信 AI 應用,這一點從本次試用中可以明顯看出,其中使用了許多 NVIDIA 軟件工具包。這包括用于生成式 AI 的 NIM 微服務、RAG、VLMs、用于機器人訓練的 NVIDIA Isaac、NVIDIA NeMo、RAPIDS、用于推理的 NVIDIA Triton,以及用于 AI 代理的無服務器 API。

    電信行業正處于成為 AI 服務提供商的巨大機遇的前沿。AI-RAN 可以利用加速計算作為無線網絡的新基礎,為全球電信公司開啟這種新的復興。

    此公告標志著 AI-RAN 技術的突破性時刻,證明了其可行性、電信級性能、卓越的能效和經濟價值。在 NVIDIA 加速的 AI-RAN 基礎設施上,每投入 1 美元的資本性支出就會產生 5 倍的收入,同時支持 6G。

    AI 盈利之旅可以立即開始。

    ?

    +2

    標簽

    人人超碰97caoporen国产