logo

为什么SFT后LLM的性能变得更好了?

有监督微调是怎么改进预训练模型性能的?
评论
用户头像