目录 代码总结 1. 环境设置 2. 数据源 3. 使用 filter 进行分流 4. 使用侧输出流进行分流 5. 执行任务 代码拓展 1. 侧输出流的应用场景 2. 性能优化 3. 更复...
整体流程 首先回顾一下dispatch的过程,dispatch是两阶段的,第一阶段是机间同号gpu之间通过rdma的发送,第二阶段是机内通过nvlink的中转,rank0的视角如下...