2024 DPU & AI Networking创新大会日前在北京圆满落幕,大会表彰了在DPU与AI网络技术创新及实践应用中取得卓越成就的单位与项目。会上,浪潮信息「X400超级AI以太网解决方案」凭借领先的端网协同技术,显著提升了大模型训练效率,荣获“2024 DPU & AI Networking Awards 创新引擎奖”。
随着AIGC的发展,大模型的参数量越来越大,如何借助 AI 网络将上千台AI 服务器系统互联,充分释放算力资源的全部潜力,加速 AI 大模型训练,成为 AIGC 时代的新挑战。此次获得“2024 DPU & AI Networking Awards 创新引擎奖”的浪潮信息X400 AI Fabric专为AIGC场景打造,能够为用户构建可弹性扩展至524,288个GPU的超大规模AI系统,凭借AR自适应路由、端到端拥塞控制、亚毫秒级故障自愈等技术,性能提升至传统RoCE网络的1.6倍,实现了AI网络的超高吞吐量、高可扩展性和超高可靠性,极大提升大模型训练性能,大幅缩短训练时长并降低训练成本。
目前,X400超级AI以太网解决方案已经在互联网等行业实现测试应用。在大规模AI算力系统网络调度过程中,相比传统RoCE网络方案,性能提升1.6倍,带宽利用率超过95%,通信时延降低30%,并且在多租户AI Cloud场景中,NCCL通信性能提升1.5倍,同时,该方案通过其卓越的成本效益,助力客户大幅提高投资回报,实现成本与效益的完美平衡,为智算中心客户带来更快、更好、更省的网络业务体验。
