DeepSeek 第二天开源的 DeepEP
2025/03/08
在DeepSeek开源周的第二天,团队发布了DeepEP,这是一个专为混合专家模型(MoE)和专家并行(EP)设计的高效通信库。DeepEP针对DeepSeek-V3论文中提出的组限制门控算法进行了优化,并为非对称域带宽转发提供了高性能核心,这些核心不仅具有高吞吐量,适合训练和推理预填充任务,还支持流多处理器(SM)数量控制。对于延迟敏感的推理解码场景,DeepEP包含一组纯RDMA低延迟核心,将延迟降至最低,并引入了基于钩子的通信-计算重叠方法,不占用任何SM资源,进一步提升效率。