负载均衡[2]

Nvidia 数据包喷洒技术、自适应路由技术实验验证

数据包喷洒技术是一种保证网络链路均匀性的技术,它基于包或者cell进行负载均衡。 本文基于Nvidia Connect X6 DX网卡,开启网卡无序报文接收功能,使用支持乱序传输的RoCEv2 RC协议,对该技术进行实验验证。

如何解决AI/ML训练中负载不均问题?包转发还是流转发?

如何解决AI/ML训练中负载不均问题?包转发还是流转发? 引言 在AI/ML训练中,单个GPU与其他GPU同步训练数据时,通常发送多少个活动IP流? 答案是只有一个。而且流量以满接口速率发送,目前是400Gbps。 现在以太网架构,最常用的负载均衡方式是根据流负载均衡。这种方式在GPU训练场景(流数