登录/注册
个人中心
消息中心
退出登录
1
已经有SFT、Prompt tuning、LoRA了,为什么还要有奖励模型训练和强化学习训练?
大模型开发
/
互助问答
文心大模型
SFT
P-tuning
2023.08.28
6989看过
这几个方式会有什么差别么?实在是训练方法太多,不知道如何选择了
评论
相关推荐
大模型黑话指南(二)
热心市民周先生
2023.08.28
14164
10
0
什么是Fine-tuning?
热心市民周先生
2023.09.04
34630
2
0
【FAQ】千帆大模型平台常见问题梳理 (模型微调篇)
百度千帆社区
2023.08.28
23028
2
0
冰与火之歌113
关注
已关注
相关文章
需要训练一个100亿参数量的模型,怎么预估所需要的计算资源?
千帆大模型平台的强化学习机制是怎样的?
大模型有没有反编译能力?