所有文章 > 当前标签:DeepSpeed-Chat
DeepSpeed-Chat 模型与数据
DeepSpeed-Chat 模型与数据
2025/04/02
DeepSpeed-Chat 是一种高效的模型训练框架,专注于训练类似 ChatGPT 的对话模型。它使用 Hugging Face 上的公开数据和模型,支持多种语言和数据类型,如 instruction 和 conversation。其数据处理机制灵活,通过自定义的 `PromptRawDataset` 类来加载和处理数据。在训练过程中,DeepSpeed-Chat 根据不同的训练阶段(如监督微调、奖励模型微调和强化学习)对数据进行针对性处理。此外,它还支持数据缓存机制,以提高训练效率。