黑洞资源笔记
05:14 · Jun 23, 2025 · Mon
slime
:一个专注于大规模强化学习扩展的LLM后训练框架,助力高效训练和灵活数据生成。
高性能训练,通过连接Megatron与SGLang实现高效多模式训练;灵活的数据生成工作流,支持自定义数据生成接口和服务器引擎;提供GLM4-9B和Qwen3-4B模型示例,方便快速上手。
Home
Powered by
BroadcastChannel
&
Sepia