登录/注册
个人中心
消息中心
退出登录
1
已经有SFT、Prompt tuning、LoRA了,为什么还要有奖励模型训练和强化学习训练?
大模型开发
/
互助问答
文心大模型
SFT
P-tuning
2023.08.28
6265看过
这几个方式会有什么差别么?实在是训练方法太多,不知道如何选择了
评论
相关推荐
文心大模型4.0接口限时免费!全量开通
百度千帆社区
2023.10.25
66825
18
35
【有奖征集】寻找游戏“大模王”
百度千帆社区
2023.11.09
48264
17
9
只需三步,玩转火爆全球的DeepSeek
百度智能云服务交付中心
2月6日
30284
0
9
冰与火之歌113
关注
已关注
相关文章
需要训练一个100亿参数量的模型,怎么预估所需要的计算资源?
千帆大模型平台的强化学习机制是怎样的?
大模型有没有反编译能力?
热点话题
湖南高速×百度智能云:首个公路数字化转型成果落地
知欧
484 看过
对话刘慈欣:未来十年,整个社会生活都会被AI重新定义
Coderabbit
417 看过
文末可预约直播|剧透预警!百度世界2025倒计时,准备好迎接AI「炸场」了吗?
百度千帆社区
487 看过
百度智能云协同郑州腾佑科技举办AI分享会,赋能企业智能化升级
AI加速器
389 看过