喜讯!陈文智教授团队论文再次被SIGCOMM录用

    近日,浙江大学计算机系统结构实验室(ZJU ARClab)与阿里云的最新成果“Triton: A Flexible Hardware Offloading Architecture for Accelerating Apsara vSwitch in Alibaba Cloud”20245月被网络领域“四大顶会”之一的Special Interest Group on Data CommunicationSIGCOMM 2024)录用。该论文由陈文智教授指导,介绍了ARClab科研团队与阿里云联合研究的下一代Apsara vSwitch (AVS) 软硬件协同架构 Triton

会议介绍


SIGCOMM是由ACM举办的计算机体系结构/计算机数据通信领域最重要的学术会议之一,与NSDI, MOBICOM, INFOCOMM并称为计算机网络领域的四大顶会。 SIGCOMM对论文质量和数量要求极高,质量方面要求具有基础性贡献、领导性影响和坚实系统背景。本次会议共收到366篇投稿,录取62篇,录取率约为16.9%

传统 Sep-path架构的缺陷和面临的挑战

Apsara vSwitch (AVS) 作为阿里云的核心转发组件,采用 Sep-path 架构加速其转发性能。Sep-path架构由独立的两条转发路径组成,软件部分包含了完整的数据路径,硬件部分作为一个转发缓存实现加速。然而,这种架构随着大规模部署和网络流量的增长,面临着新的问题:(1)用户流量通过两条性能差距过大的路径转发,不可预测的性能无法保障SLA;(2)硬件加速器的开发带来的复杂性和时间成本阻碍了AVS的迭代升级;(3)硬件维护和软硬件交互的维护带来了极高的运维成本。

Triton软硬件协同设计实现了统一的数据路径

Triton AVS 的工作负载进行建模,将数据包转发任务划分为解析、匹配和动作阶段,根据每个阶段的特点将不同任务合理地在软硬件之间分配,并实现了一条统一的数据路径。灵活性较强的任务由软件完成,而硬件负责辅助加速固定且重复的任务。对于潜在的性能瓶颈,Triton采取了多种优化手段,包括流聚合、向量化处理以提升PPS,支持巨型帧、包头-负载切割以提升BPS。这种架构不但拉齐了软硬件的性能差距、提升了开发效率和降低了运维成本,还简化了软硬件之间的信息同步机制,提供了更多的性能监测工具。实验表明,Triton实现了可预期的性能,拥有与硬件转发峰值性能相近的吞吐量和PPS,同时新建连接能力提升了72%,单一路径引起的延迟增加仅为2.5微秒。

作者介绍

论文第一作者李星(阿里云、浙江大学在读博士),第二作者蒋骁翀为浙江大学计算机系统结构实验室(ZJU ARClab)在读博士,主要研究方向为云网络软硬件协同设计、下一代高性能网络架构设计等。


<<< 返回