在當今的數據中心,通過連接到網絡的服務器實現系統冗余的方法有很多。客戶通常會尋求冗余來提高服務可用性(例如實現端到端 AI 工作負載),并使用不同的多歸技術來提高系統效率。
在本文中,我們將討論知名的專有多機箱鏈路聚合組 (MLAG) 與基于標準的 EVPN 多歸站 (EVPN-MH) 相比的優缺點。
MLAG 簡介
對于所有現代數據中心而言,多歸位都是必要的,這使得單個主機能夠連接到兩個或多個節點,并以全主動或單主動的方式提供服務。全主動側重于首先增加容量,其次是冗余。單主動主要側重于冗余。
在互聯網服務提供商領域,多域名 (Multihoming) 是一個常見的概念,主要用于接入點位置,即客戶設備與提供商邊緣設備位置互連。
此連接幾乎始終是第 3 層路由連接,不會帶來第 2 層世界的挑戰,因為它旨在解決冗余站點訪問或互聯網訪問。但是,在數據中心,當我們以冗余方式將服務器或終端節點連接到網絡時,我們必須深入到第 2 層。
MLAG 出現于 2010 年代早期,許多供應商實施了類似的功能。需要記住的一點是,MLAG 是依賴于供應商的專有技術。根據維基百科,MLAG’s “實施情況因供應商而異;值得注意的是,機箱之間的現有協議是專有的。” 這是一個基本問題,MLAG 會觸發許多其他問題。

借助 MLAG (圖 1),客戶端設備可以是服務器或 hypervisor,交換機或路由器形成經典鏈路聚合組 (LAG),通常將兩個物理鏈路綁定到單個邏輯鏈路中。在這些鏈路的另一側,您通常有兩個交換機,這些鏈路將其連接到。從 LACP 的角度來看,這兩個交換機的作用就像具有相同 LACP 系統 ID 的單個交換機。這使得 MLAG 從服務器的角度來看工作。
但是,對于兩個參與 MLAG 的交換機而言,事情要復雜得多。因為它們需要它們之間的狀態和 MAC 同步,因此還需要進行心跳,以防止在其中一個參與的交換機失去其上行鏈路的情況下發生腦裂和流量流經對等鏈路。這種對等鏈路使整個設計不標準、復雜且容易出錯(不適合 CLOS Leaf 和 Spine 架構)。
目前,我們正在努力制定狀態和 MAC 同步標準。RFC7275 專注于解決此問題,并引入了一個名為“機箱間控制協議 (ICCP)”的新協議。然而,不同的供應商仍然實施各種不同的 RFC7275 解決方案,最終會遇到相同的問題。這種 MLAG 解決方案在有限的范圍內解決了多歸問題。
雖然 MLAG 的前景暗淡,但有一種更靈活、技術更出色的多歸系統解決方案:EVPN 多歸系統(也稱為 EVPN-LAG 或 ESI-LAG)。
EVPN 多歸屬的優勢
ISP 領域并不陌生,最初是作為一種 WAN 技術出現的。但是,很顯然,現代數據中心需要自己的方式來實現多主。
恰巧,EVPN 本身最初是作為一種 WAN 技術引入的,然后演變為數據中心技術。EVPN 采用多歸位功能的速度相當快。隨著 RFC7432, EVPN-MH 使用名為以太網段標識符 (ESI) 的新尋址字段。這種使 EVPN – MH 正常工作的基本構建塊在整個網絡中隨處使用,只要傳播 1 型和 4 型路由即可。ESI 是一個 10 字節的字段,用于指定特定的多住址段。
我們來談談 EVPN-MH 的特點、路線類型,以及與傳統和專有的 MLAG 相比,是什么讓它更具吸引力。
EVPN-MH 使用邊界網關協議 (BGP) 作為控制平面,而 MLAG 使用 ICCP.此外,EVPN – MH 根據 RFC7432 使用幾種不同類型的 EVPN 路由類型。
EVPN Type-1 路由
EVPN Type-1 路由功能可列為批量提取、混疊和負載共享(圖 2)。
大規模退出
大規模提取可確保,如果 ES 上的特定鏈路發生故障,您可以提取連接到該特定鏈路的所有依賴 MAC 地址。這樣,您可以通過發送大規模提取而不是針對每個 MAC 逐個提取來實現快速收。這假設 hypervisor 通過多個 VM、相同的 VLAN 或數百個 VLAN 連接到該 ES.
混疊和負載均衡
混疊和負載均衡可確保 ES 成員交換機(也稱為 EVI)之間的下游流量負載均衡。這樣,ES 成員交換機可以以負載共享的方式接收來自網絡中其他交換機的流量,而不管他們是否在 ES 后面發布特定 MAC.

EVPN Type-2 路由
Type-2 (MAC/IP) 路由由相同的 ES 成員 leaf 公告,并且包含連接到此以太網段的每個 MAC 的 ESI 值(圖 3)。

Type-2 路由不是 EVPN-MH 設置的一部分,但是,當 ESI 信息存在于特定目標 MAC 時,它們會使用 ESI 信息。
EVPN 路由類型 4
EVPN Type-4 路由用于選擇指定轉發器 (DF) 和多節點 ES 的自動發現(圖 4)。

EVPN Type-1 和 Type-4 路由使 EVPN-MH 能夠正常工作,并提供基于標準的互操作性。Type – 4 路由僅由參與該特定 ES 的路由器或 leaf 導入。不參與該 ES 的其他路由器或網絡中的 leaf 不會導入 type – 4 路由。Type – 4 路由用于 DF 選擇,以選擇本地 BUM 流量的發送位置。由于 BUM 流量必須在整個網絡中被洪水淹沒,因此在多住址場景中,只有 DF 負責將 BUM 流量發送到其客戶端(例如多住址服務器)。
典型的 EVPN-MH 拓撲結構如圖 5 所示。

EVPN-MH 的優勢:
- 基于控制面板的 MAC 和狀態同步
- 基于標準的 BGP EVPN 路由類型和互操作性
- 多基元連接的全網絡路由分布
- 快速收、提取
- 支持 2 個以上的多歸點
- 無需物理對等鏈路連接
- 未來驗證
- 通過 BGP 實現擴展
結束語
EVPN-MH 是一項面向未來的技術,使用 BGP 作為其控制平面。其基于標準的架構、能夠通過兩個以上網關為終端主機提供多歸站以及主動 – 主動負載均衡,使其成為現代數據中心網絡中一個有吸引力的事實解決方案。此外,消除了對 Leaf 之間對等鏈路的需求,使 EVPN – MH 非常適合 Clos 架構,從而降低成本和復雜性。
我建議將 EVPN-MH 用作數據中心的控制平面,這將很快取代現場的所有 MLAG 部署。現有網絡可以保留 MLAG,因為它們已經投入使用。但是,新的部署和設計當然應該基于 EVPN – MH.
有關更多資源,請查看 NVIDIA Cumulus Linux 多機箱鏈路聚合 – MLAG 配置指南。
?