写点什么

SD-WAN 和专线混合组网中的高可用设计(三)

  • 2019-12-20
  • 本文字数:1312 字

    阅读完需:约 4 分钟

SD-WAN 和专线混合组网中的高可用设计(三)

方法 2: 通过路由传播功能,控制明细路由

在 AWS VPC 网络中有一个特性,即如果存在到达路径的多个不同路由条目,则会选取最明细的一条路径。


举个例子,如果我们需要到达 10.0.0.1 的机器,目前路由表中有条目 A(10.0.0.0/8,下一跳 VGW-A),有条目 B(10.1.0.0/24,下一跳是 VGW-B),两个路由条目都包含了去目标机器的路由,但是 VPC 此时会选择条目 B,因为它更精细。


基于这个特性,我们也可以设计出在 Direct Connect 专线和 SDWAN 线路之间的动态路由切换机制。

打开路由传播功能

首先到所有的 VPC 的相应路由表中,打开路由传播的功能,此功能默认是关闭的。



勾选传播这个选项,然后保存。



开启了路由传播功能之后,我们可以看到这个路由表已经收到了来自 Customer Gateway 的动态路由条目了。这里也是所有 SDWAN 网络里面包含的路由条目。



编辑路由表,将 SDWAN 的路由设置得更范围更大一些,让它不优先起作用。


高可用测试

我们到 SDWAN 控制台将 Direct Connect 线路手动断掉,并且我们保持 AWS 北京的一台客户端长期 ping 一个新加坡客户端的地址。


可以看到,在断开线路的一瞬间,我们可以看到路由表的 ”Propagated“ 路由条目中 ”Yes“ 的路由已经消失了,只剩下一些手动创建的路由条目。并且这些路由条目也能指引客户端找到访问对端的路径,并且这些路径是经过 SDWAN 网络过去的。



在整个切换过程中,持续的 Ping 只丢了 3 个包,切换时间还是非常迅速的。



同样,我们如果将 Direct Connect 线路恢复,这些动态路由也会在几分钟之内完全恢复。

优劣分析

第二种方法的切换时间更快,而且在出现专线故障的情况下,我们希望切换的这个过程越快越好,而如果专线恢复,我们对切换回来的时间要求相对就没那么高了。所以这个方法还是很符合实际的使用要求的。


但如果路由条目比较复杂,我们在编写泛路由的时候需要比较小心,而且也需要注意 VPC 中路由表条目的硬限制(100 个路由条目)。

总结

在业务连续性和 RTO (Recovery Time Objective) 要求比较高的情况下,非常建议在网络的设计中考虑到双设备,双线路的冗余。并且需要整个切换的过程自动化,对业务的影响最小。


本文提供的两种方法,各有优缺点:


  1. AWS CLI 方法:能够集成更多功能,比如 VPC 路由表切换,SNS 等,能为切换带来更多的操作可能性;但切换时间在 3-5 分钟不等。

  2. 路由传播方法:从 DX 切换到 SDWAN 的切换时间在 3 秒左右,反过来的切换时间在几分钟的时间内,并且操作更加简单,不涉及 IAM 设置和两套路由表以及监控脚本。

参考文档

https://www.cisco.com/c/en/us/support/docs/cloud-systems-management/prime-access-registrar/213601-csr1000v-ha-redundancy-deployment-guide.html


作者介绍:


!



### [](https://amazonaws-china.com/cn/blogs/china/tag/%E8%82%96%E5%9F%B9%E5%BA%86/)
亚马逊AWS解决方案架构师,负责基于AWS的云计算方案架构的咨询和设计,同时致力于AWS云服务在国内的应用和推广。现主要负责初创企业行业解决方案,曾任职于IBM,联想,Avnet,多年大型企业网络架构和运维经验。
复制代码


本文转载自 AWS 技术博客。


原文链接:https://amazonaws-china.com/cn/blogs/china/highly-available-design-snares-in-sd-wan-and-private-line-hybrid-networks/


2019-12-20 14:22913

评论

发布
暂无评论
发现更多内容

搞懂 ELK 日志系统架构,这一篇就够了(含实战图解)

左诗右码

9个CST电磁仿真软件电路获取S参数的方法

思茂信息

cst cst仿真软件 CST软件

TinyEngine 2.8 正式上线:AI能力就位、Docker一键起飞!

OpenTiny社区

开源 前端 低代码

YashanDB数据库缓存机制及快速访问优化技巧

数据库砖家

技术干货丨基于SimSolid的塑胶模具温度场瞬态分析

Altair RapidMiner

汽车 制造业 仿真 CAE SimSolid

企业内网即时通讯软件,怎样的软件适合企业使用?

BeeWorks

即时通讯 IM 私有化部署

YashanDB数据库缓存机制的工作原理介绍

数据库砖家

YashanDB数据库故障恢复自动化流程分享

数据库砖家

YashanDB数据库管理系统升级与迁移实战教程

数据库砖家

YashanDB数据库故障恢复与备份最佳实践

数据库砖家

哈尔滨等保测评流程:从准备到完成的详细指南

等保测评

会议室无缝LED视频墙:高效沟通

Dylan

会议室 LED display LED显示屏 投影仪 LED屏幕

哈尔滨等保测评:企业如何高效通过测评

等保测评

构建 AI 智能体的实用开源技术栈(框架、计算机与浏览器操控、语音功能、文档理解...)

Baihai IDP

人工智能 AI 智能体 LLM AI Agent

如何通过Python SDK 获取Collection

DashVector

人工智能 数据库 AI 向量检索 大模型

YashanDB数据库故障诊断与恢复策略解析

数据库砖家

区块链RWA系统的资产标准化

北京木奇移动技术有限公司

区块链开发 软件外包公司 RWA开发

YashanDB数据库集成AI技术提升智能分析能力

数据库砖家

华为云Tokens服务全面接入384超节点,以“大杂烩”优势打造先进算力

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 CloudMatrix384超节点 Tokens

《烟草行政处罚案卷制作与评查平台研发纪实》,深度剖析精益求精的背后历程

中烟创新

企业为什么内部要用专业的即时通讯工具?BeeWorks总结这几点

BeeWorks

即时通讯 IM 私有化部署

首届AI国际人才峰会启幕,智源携手港投公司共筑青年创新生态

智源研究院

人工智能

YashanDB数据库故障自动修复机制详解

数据库砖家

大数据-80 Spark 从 MapReduce 到 Spark:大数据处理引擎的三代演进全景解析

武子康

scala 大数据 flink spark 分布式

邀请函丨Altair 2025 青年才俊支持计划启动!

Altair RapidMiner

人工智能 AI 仿真 CAE Simlab

YashanDB数据库故障诊断与快速修复指南

数据库砖家

YashanDB数据库缓存优化策略及实践

数据库砖家

详细教程:如何利用nslookup命令查询DNS解析状态?

国科云

YashanDB数据库故障诊断及自动恢复技术

数据库砖家

从零构建AI测试平台:文档解析与知识库构建全解析

测试人

YashanDB数据库集群故障诊断及恢复实战

数据库砖家

SD-WAN 和专线混合组网中的高可用设计(三)_文化 & 方法_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章