Tinker Cookbook 提供了丰富的示例和工具,帮助开发者和研究人员轻松定制和微调大语言模型。它基于 Tinker API,封装了多种训练抽象,让你一步步实现有监督学习、强化学习、偏好学习等复杂训练流程。

主要亮点:

- 训练SDK支持分布式微调,无需自己搭建复杂环境;
- 丰富的示例代码覆盖对话微调、数学推理、工具使用、多智能体对抗等场景;
- 提供评估工具和超参数计算辅助,方便快速迭代;
- 支持下载模型权重,一键体验训练成果;
- 完全开源,社区驱动,欢迎贡献和交流。

适合想深入大模型训练原理、快速上手微调的开发者和科研人员。
 
 
Back to Top