登录/注册
个人中心
消息中心
退出登录
1
2
千帆大模型平台的强化学习机制是怎样的?
大模型开发
/
互助问答
LLM
文心大模型
2023.08.28
2268看过
强化学习(包括深度强化学习)本质上是在学习什么? 千帆大模型平台的强化学习机制又是什么样的?
评论
相关推荐
刷新记录!百度百舸助力LLaVA-OneVision-1.5高效训练
知欧
10月29日
1524
0
0
百度千帆·大模型服务及Agent开发平台——交互式写作Agent 使用态(2)
十万个为什么呢
11月6日
957
0
0
百度千帆·大模型服务及Agent开发平台实践——多模态RAG:图文问答助手
徐徐大树
11月6日
1518
0
0
冰与火之歌113
关注
已关注
相关文章
需要训练一个100亿参数量的模型,怎么预估所需要的计算资源?
已经有SFT、Prompt tuning、LoRA了,为什么还要有奖励模型训练和强化学习训练?
大模型有没有反编译能力?
热点话题
湖南高速×百度智能云:首个公路数字化转型成果落地
知欧
482 看过
对话刘慈欣:未来十年,整个社会生活都会被AI重新定义
Coderabbit
416 看过
文末可预约直播|剧透预警!百度世界2025倒计时,准备好迎接AI「炸场」了吗?
百度千帆社区
486 看过
百度智能云协同郑州腾佑科技举办AI分享会,赋能企业智能化升级
AI加速器
384 看过