登录/注册
个人中心
消息中心
退出登录
2
17
人类反馈强化学习的反馈数据怎么来的?
大模型开发
/
互助问答
数据集
大模型训练
大模型推理
2023.08.25
9217看过
如果是人工标注的话,大概的流程、人工、规模,减轻标注负担的方法是什么样的?还有就是reward模型用的哪个?
评论
相关推荐
AppBuilder 0.5.0发版上线公告|欢迎试用
AppBuilder
2024.04.29
7172
3
2
重磅发布!文心旗舰大模型ERNIE 4.0 Turbo现可支持精调
千帆大模型平台官方小助手
2024.08.21
12476
7
12
一文搞懂:Ernie系列模型的QPS、RPM、TPM有什么不一样
百度智能云千帆社区
2024.09.12
34948
0
0
十万个为什么呢
关注
已关注
相关文章
快速上手SFT(一):识别应用场景
局内人亲述:DeepSeek爆火后,大厂和创业者如何接住这波AI红利?
市场份额第一!百度智能云曦灵实力领跑数字人行业
热点话题
秒哒上新!助力企业数字化,免费提供后端数据库服务
未名瞎话
508 看过
北京市经开区x百度智能云:多模态大模型助力全域城市治理“看得懂、管得快”
Coderabbit
628 看过
千帆AppBuilder【百度AI搜索开发赛】开发期延期公告!
百度智能云千帆社区
20664 看过
【百度AI搜索开发赛】活动策划师智能体^_^策划有料,热点随行
guojialing1997
1649 看过