16:00 · May 12, 2023 · Fri × × × × 大语言模型(LLM)微调技术笔记 | 传送门 | #笔记在预训练后,大模型可以获得解决各种任务的通用能力。然而,越来越多的研究表明,大语言模型的能力可以根据特定目标进一步调整。这就是微调技术,目前主要有两种微调大模型的方法1:指令微调,目标是增强(或解锁)大语言模型的能力。2:对齐微调,目标是将大语言模型的行为与人类的价值观或偏好对齐。