高可用性

本主题介绍 SD-WAN 设备(标准版和高级(企业版)支持的高可用性(高可用性)部署和配置。

Citrix SD-WAN 设备可以在高可用性配置中作为主动/备用角色中的一对设备进行部署。有三种高可用性部署模式:

  • 并行在线高可用性

  • 故障到线的高可用性

  • 单臂高可用性

这些高可用性部署模式类似于虚拟路由器冗余协议 (VRRP),并使用专有 SD-WAN 协议。SD-WAN 网络中的客户端节点(客户端)和主控制节点 (MCN) 都可以在高可用性配置中进行部署。主设备和辅助设备必须是相同的平台型号。

在高可用性配置中,站点中的一个 SD-WAN 设备被指定为活动设备,并由备用设备监视。配置在两个设备之间进行镜像。如果备用设备在定义的时间段内失去与活动设备的连接,则备用设备将采用活动设备的标识并接管流量负载。根据部署模式,此快速故障转移对通过网络的应用程序流量的影响最小。

高可用性部署模式

单臂模式:

在单臂模式下,高可用性设备对位于数据路径之外。应用程序流量将重定向到具有基于策略的路由 (PBR) 的设备对。当网络中的单个插入点不可行或者用于应对故障到线的挑战时,将实现单臂模式。备用设备可以添加到与活动设备和路由器相同的 VLAN 或子网。

在单臂模式下,建议 SD-WAN 设备不驻留在数据网络子网中。虚拟路径流量不必遍历 PBR 并避免路由循环。SD-WAN 设备和路由器必须通过以太网端口或在同一 VLAN 中直接连接。

用于回退的 IP SLA 监视

只要 SD-WAN 设备之一处于活动状态,即使虚拟路径处于关闭状态,活动流量也会流动。SD-WAN 设备将流量重定向回路由器,因为 Intranet 流量。但是,如果两个活动/备用 SD-WAN 设备都变为非活动状态,路由器会尝试将流量重定向到设备。如果下一台设备无法访问,则可以在路由器上配置 IP SLA 监视以禁用 PBR。这允许路由器回退以执行路由查找并适当转发数据包。

并行内联高可用性模式:

在并行内联高可用性模式下,SD-WAN 设备彼此并行部署,并与数据路径内联。只使用通过活动设备的一个路径。请务必注意,旁路接口组配置为无法阻止和无法连接,以便在故障转移过程中不会获得桥接循环。

可通过内联接口组或设备之间的直接连接来监视高可用性状态。外部跟踪可用于监视上游或下游网络基础设施的可达性。例如,如果需要,切换端口故障转换为直接更改高可用性状态。

如果主动和备用 SD-WAN 设备都被禁用或失败,则可以直接在交换机和路由器之间使用第三级路径。此路径的生成树成本必须高于 SD-WAN 路径,以便在正常条件下不使用。并行内联高可用性模式下的故障转移是一种快速且几乎无中断的操作,因为没有发生任何物理状态更改。回退到三级路径并不是无击中的,并且根据生成树配置,可以阻止流量 5-30 秒。如果存在到其他 WAN 链接的路径外连接,则必须将两个设备连接到它们。

本地化后的图片

在更复杂的情况下,如果多个路由器可能正在使用 VRRP,建议使用非路由 VLAN,以确保在第 2 层可以访问 LAN 侧交换机和路由器。

本地化后的图片

故障到线模式:

在故障到线模式下,SD-WAN 设备在相同的数据路径中内联。旁路接口组应处于故障到线模式,待机设备处于直通或旁路状态。必须为高可用性接口组配置并使用单独端口上的两个设备之间的直接连接。

注意

  • 故障到线模式下的高可用性切换需要更长的时间,大约 10-12 秒,这是因为端口延迟从故障到线状态恢复。

  • 如果设备之间的高可用性连接失败,则两台设备都进入活动状态并导致服务中断。可以通过分配多个高可用性连接来缓解这种情况,以避免单点故障。

  • 在高可用性故障到线模式下,硬件设备对中必须使用单独的端口来实现高可用性控制交换机制,以帮助实现状态收敛。

  • 由于 SD-WAN 设备从活动切换到待机时物理状态发生变化,故障转移可能导致部分连接丢失,具体取决于自动协商在以太网端口上所需的时间。

  • 建议在自动协商的端口上使用故障到线模式,因为这会增加故障转移时间。

下图显示了故障到线部署的示例。

本地化后的图片

对于转发大量流量的数据中心或站点,建议使用 One-Arm 高可用性配置或并行内联高可用性配置,以最大限度地减少故障转移期间的干扰。

如果在故障转移期间可以接受最小的服务损失,则故障到线高可用性模式是更好的解决方案。故障到线高可用性模式可防止设备故障,并行内联高可用性可防止所有故障。在所有情况下,高可用性对于在系统故障期间保持 SD-WAN 网络的连续性都很有价值。

配置高可用性功能

要配置高可用性:

  1. 在配置编辑器中,导航到 站点 > 站点名称 > 高可用性。选择 启用高可用性, 然后单击 应用。

    本地化后的图片

    本地化后的图片

  2. 键入以下参数的值:

    • 高可用性设备名称: 这是高可用性(辅助)设备的名称。

    • 故障转移时间: 指定与主设备的联系丢失后,备用设备变为活动状态之前的等待时间(以毫秒为单位)。

    • 共享基础 MAC: 这是高可用性对设备的共享 MAC 地址。发生故障转移时,辅助设备具有与发生故障的主设备相同的虚拟 MAC 地址。

    • 交换主/辅助: 选择此选项时,如果高可用性对中的两个设备同时出现,则辅助设备将成为主设备,并优先考虑。

  • 主回收: 选择此选项时,指定的主设备会在故障转移事件后重新启动时回收控制。

  • 高可用性故障到线模式: 对于故障到线高可用性部署模式,选择此模式。

    注意

    对于 Hypervisor 和基于云的平台,可使用额外的参数 禁用共享基础 MAC。选择此选项可禁用共享虚拟 MAC 地址。 注意

    对于基于 Hypervisor 的平台,请确保在虚拟机管理程序上启用混杂模式,以允许从高可用性共享 MAC 地址进行数据包采购。如果未启用混杂模式,您可以启用禁用 共享基础 MAC. 选项。

单击 高可用性 IP 接口旁边的 **+ 以 配置接口组**。键入以下参数的值:

  • 虚拟接口 — 这是用于高可用性对中设备之间通信的虚拟接口。此接口监视活动设备的可达性。对于单臂高可用性模式,只需要一个接口组。

  • 设备 — 这是主设备的唯一虚拟 IP 地址。辅助设备使用此功能与主设备进行通信。

  • 辅助 — 这是辅助设备的唯一虚拟 IP 地址。主设备使用此功能与辅助设备进行通信。

单击新的 高可用性 IP 接口 条目左侧的 +。在 外部 跟踪 IP 地址 字段中,键入响应 ARP 请求的外部设备的 IP 地址以确定主设备的状态,然后单击 应

注意:

您还可以从设备手动触发 HA 切换。导航到 配置 > 设备设置 > 管理员界面 > 其他。在 切换 HA 模式 部分中,单击 切换到待机切换到活动,具体取决于 HA 设备。 本地化后的图片

监视

要监视高可用性配置,请执行以下操作:

登录到已实现高可用性的活动和备用设备的 SD-WAN Web 管理界面。在 控制板 选项卡下查看高可用性状态。

本地化后的图片

本地化后的图片

有关活动和备用高可用性设备的网络适配器详细信息,请导航到 配置 > 设备设置 > 网络适配器 > 以太 网选项卡。

本地化后的图片

本地化后的图片