基于P4可编程芯片(Barefoot/Tofino)的统一公网网关解决方案
- 问题: pipeline的限速表项占满时,有概率出现限速失效
- 状态: 已知缺陷
- 问题: 在dual rate limiter表放置于同一stage下时,有概率出现互相冲突
- 状态: 已知缺陷
| 企业 | 方案 | 特点 |
|---|---|---|
| 阿里云 | XGW (Tofino) | 流量分发、跨Region、支持IPv6 |
| 阿里云 | LuoShen | 融合网关、新型架构 |
| 阿里云 | Sailfish | 可编程网关 |
| 腾讯云 | TGW | EIP、四层CLB、BGP/三网 |
| 京东云 | BGW | VPC南北向流量、专线/VPN |
| 滴滴云 | 可编程网卡 | 网卡级方案 |
| 天翼云 | 自研P4白盒交换机 | T级带宽、路由规格40万+ |
- NSDI'24 阿里云洛神云网络论文
- 阿里SIGCOMM论文 - Sailfish可编程网关
- 滴滴可编程网卡应用实践
- P4设备工业界落地情况
- 腾讯TGW架构演进
- 腾讯TGW深度解读
- 天翼云P4白盒交换机
- 优势: 基于Barefoot设备演进,跟进业界技术发展
- 对标: 竞品分析
- 国产芯片方案: 华为、中兴等国产Barefoot设备可替代进口方案
- 目标: 达成信创合规性要求
- vs X86 + DPDK: 需要大量机器,成本高
- Barefoot方案: 硬件性能强劲,机器数量少
问题: 软件旧版方案
- 节点限速75%,总限速1.5倍(为做互备而设计)
- GTC分布式计算导致秒级限速不均衡
- IP加入/移除时出现流量黑洞
解决方案:
- 统一集中限速,收敛公网IP能力
- 集群内/外导流技术,去除GTC等外部依赖
- 用户配置规格与实际实现一致
优势:
- 产品体验: 配置规格与实现完全一致
- 架构简洁: 减少外部组件依赖
旧版问题: 单点故障缺乏灾备,无异构能力
集群方案:
- 多IGW集群间相互宣告相同VIP
- 路由自动故障转移
- AS_PATH控制segment宣告
- 故障时可自动降级至DPDK版本
优势:
- 稳定性: 异构设计避免硬件/语言问题
- 快速恢复: 大小VIP宣告实现秒级故障转移
- 架构简洁: 无需其他模块开发适配