logo
话题头图

全新训练方法上线!新增知识蒸馏训练方式,轻松打造推理能力及性能兼优的轻量级模型

7月4日千帆模型开发平台ModelBuilder已更至最新版本,本次更新围绕模型服务升级与工具链升级。欢迎各位开发者来千帆模型开发平台ModelBuilder,体验更全面、更便捷的服务。
💡此次更新亮点速览:
  1. DeepSeek-V3、DeepSeek-R1系列预置服务支持购买搜索增强量包。
  2. 可灵视频生成服务支持V2.1-图生视频、V2.1-Master-文生视频和图生视频。
  3. 千帆模型开发平台模型精调SimPO功能模型已于7月3日下线。
  4. 新增知识蒸馏的训练方式,支持学生模型学习真实标签和教师模型的输出概率分布,将复杂教师模型的知识迁移至学生模型中,获得推理能力和性能兼备的轻量级模型。
⬇️下滑查看更新详情⬇️
登录百度智能云千帆大模型开发平台同步进行文字和功能的体验效果更佳平台网址:

模型服务更新
第三方大模型
1.DeepSeek系列模型
  • DeepSeek-V3、DeepSeek-R1系列预置服务支持购买搜索增强量包。
2.可灵系列模型
  • 可灵视频生成服务支持V2.1-图生视频、V2.1-Master-文生视频和图生视频。
3.Qwen系列模型
  • 上线Qwen3-Embedding-0.6B、4B系列预置服务。
工具链升级
模型训练
  • 千帆模型开发平台模型精调SimPO功能模型已于7月3日下线,下线后将不再支持使用该工具链进行训练,但不影响已训练的SimPO系列模型后续部署和调用。如需继续使用,推荐切换至已上线的效果与性能俱佳的RFT、DPO、KTO等偏好对齐方法。
  • 增加了知识蒸馏的训练方式,可以让学生模型学习真实标签和教师模型的输出概率分布,将复杂教师模型的知识迁移至学生模型中,从而获得推理能力和性能兼备的轻量级模型。
评论
用户头像