登录/注册
个人中心
消息中心
退出登录
2
17
人类反馈强化学习的反馈数据怎么来的?
大模型开发
/
互助问答
数据集
大模型训练
大模型推理
2023.08.25
10961看过
如果是人工标注的话,大概的流程、人工、规模,减轻标注负担的方法是什么样的?还有就是reward模型用的哪个?
评论
相关推荐
【教程】百度智能云千帆大模型平台使用指南-V1.0版本(上)
百度千帆社区
2023.11.09
71651
22
13
【千帆SDK+Semantic-Kernel】RAG知识检索增强实战
千帆大模型平台官方小助手
2024.02.28
26312
6
1
【开源工具接入千帆实战系列】ChatBox使用千帆DeepSeek?安排!
百度智能云服务交付中心
2025.02.18
16391
0
5
十万个为什么呢
关注
已关注
相关文章
百度云手机:为跨境社媒营销开启增长飞轮
百度千帆视频 AI 笔记组件:技术架构解析与开发者落地实践
百度千帆商品生动化标题生成MCP:多模态驱动的电商标题智能优化方案
热点话题
深度解析百度学术:技术架构与科研效率革新实践
知欧
286 看过
百度AI搜索:独立控制台赋能开发者高效落地
Coderabbit
241 看过
实力登顶!百度千帆深度研究Agent斩获DeepResearch Bench榜首,赋能企业高效决策
百度千帆社区
287 看过
通用文字识别组件解析:全场景文本提取与智能结构化落地指南
十万个为什么呢
51 看过