撰文 | 郭冉、姚迟、郑泽康、柳俊丞 2020年末,OneFlow 发布了《OneFlow 性能优化分享:如何实现一个高效的 Softmax CUDA kernel?》 ,其中介绍了OneFlow深...
撰文|郑泽康、姚迟、郭冉、柳俊丞 逐元素操作(也叫 Elementwise 操作)是指对 Tensor 中的每个元素应用一个函数变换,得到最终输出结果。在深度学习里,...