Skip to main content

大语言模型(LLM)微调技术笔记 | 传送门 | #笔记在预训练后,大模型可以获得解决各种任务的通用能力

  1. 大语言模型(LLM)微调技术笔记 | 传送门 | #笔记

    在预训练后,大模型可以获得解决各种任务的通用能力。然而,越来越多的研究表明,大语言模型的能力可以根据特定目标进一步调整。这就是微调技术,目前主要有两种微调大模型的方法
    1:指令微调,目标是增强(或解锁)大语言模型的能力。
    2:对齐微调,目标是将大语言模型的行为与人类的价值观或偏好对齐。