大语言模型（LLM）微调技术笔记 | 传送门 | #笔记在预训练后，大模型可以获得解决各种任务的通用能力

16:00 · May 12, 2023 · Fri

大语言模型（LLM）微调技术笔记 | 传送门 | #笔记

在预训练后，大模型可以获得解决各种任务的通用能力。然而，越来越多的研究表明，大语言模型的能力可以根据特定目标进一步调整。这就是微调技术，目前主要有两种微调大模型的方法
1：指令微调，目标是增强（或解锁）大语言模型的能力。
2：对齐微调，目标是将大语言模型的行为与人类的价值观或偏好对齐。