logo
2
话题头图

【千帆SDK专属更新帖】最新V0.2.6发版公告

千帆SDK当前已经开源到Github,并将持续更新迭代,欢迎各位开发者使用订阅,如果有任何问题可以在Github以及评论区提出!
请大家点击链接并加🌟:http://github.com/baidubce/bce-qianfan-sdk

V0.2.6发版公告

发版日期:2024-1-5

1、Resource

  • 模型管理-创建模型评估任务
    • 去掉入参scoreModes
    • 去掉datasetName
    • 新增入参
      • resultDatasetStorageType
      • resultDatasetStorageId
      • resultDatasetRawPath
  • requestor优化重试机制
    • 增加可配置随机重试/指数回避重试
    • 增加可配置错误码重试
  • 增加Service.list 用于查询服务列表
  • iam鉴权统一

2、Trainer

  • 增加训练超参*

3、Evaluation

  • 支持本地评估LocalEvaluators

4、Cli

  • 新增model list
  • 新增dataset up/down
  • 新增dataset 批量刷库
  • 新增trainer 发起任务

5、Tool

  • qianfan Tool->langchain Tool转化

6、cookbook

  • 新增evaluation cookbook
  • dataset cookbook 增加Model批量推理示例

V0.2.5发版内容

发版日期:2023-12-28

1、Resource

  • requestor优化重试机制,增加可配置重试策略
  • 文生图SD新增超参
  • iam鉴权优化

2、Dataset:

  • 优化批量刷库性能,能够match实际设定的QPS
  • 优化错误重试
  • 增加刷库日志

3、Tool

  • baidu_search 搜索增强tool

4、Trainer

  • LLMFinetune接入Evaluation

5、Cli

  • 新增命令行工具qianfan
  • 支持chat/completion/text2image
  • 支持dataset up/down
  • 支持dataset批量刷库

附:目录变更

components -> common

V0.2.4发版内容

发版日期:2023-12-21

1、Evaluation

  • Evaluation 基础框架上线
  • 支持千帆平台评估

2、Dataset

  • 加入 test_using_llm 方法,允许用户直接在特定数据集上使用 Model 或者 Service 对象运行
  • 支持异步清洗

3、Model & Service

  • 添加 batch_run_on_qianfan 方法

4、Trainer

  • 支持ERNIE-Bot-turbor-0922,0516即将下线
  • Action 适配 Evaluation

5、resource

  • 加入请求Latency 统计
  • ChatCompletion、Completion stream增加首Token 时延
  • ebturbo新增tool、tool_choice,支持baidu_search
  • EB3.5 4.0新增tool_choice
  • 新增Yi_34B_Chat 预置ChatCompletion 服务
  • 对齐API model值(EB-turbo-AppBuilder、ERNIE-Bot-8K)
  • Plugin增加一言插件支持(eChart、ChatFile、ImageAI)

6、Tool

  • 转换 from Langchain to Tool
  • ebturbo搜索增强Tool

7、cookbook

  • 增加finetune数据多轮对话样例
  • 批量推理

V0.2.3发版内容

发版日期:2023-12-14

1、Resources

2、Dataset

  • 支持通过压缩包批量上传数据文件到千帆
  • 支持按文件为粒度导入泛文本数据

3、Tool

  • 新增Tool框架
  • from langchain Tool转换
  • 常用工具拓展
    • wikipedia
    • arxiv
    • duckduckgo

4、Trainer

优化体验,修复已知问题
  • DeployConfig增加poolType默认参数
  • PeftMethod改为枚举变量
  • TrainAction优化日志显示信息
    • 新增日志link
    • vdl link延迟打印

5、Cookbook

  • dataset Operator
    • 千帆平台算子补充

6、其它

  • 修复了 Console Requestor 重试时的 URL 路径错误拼接问题
  • Requestor 支持从配置获取重试配置
  • eval -> console cookbook

V0.2.2发版内容

发版日期:2023-12-07

1、Resources API

2、Trainer

  • action支持可恢复resume()
  • fix deploy流程

3、Dataset

  • load 方法支持直接从 Huggingface Dataset 导入
  • 从文件夹批量导入数据集的支持(严格意义上的)
    • 嵌套目录

4、Cookbook

  • SequenceChain
  • eval -> console cookbook

V0.2.1发版内容

发版日期:2023-11-30

1、Resources

2、Component

  • Hub
  • Prompt 上线

3、Dataset

  • 新功能:
    • Dataset 同时支持数组模式表示与 Table 模式表示
    • 新增 Insert 类函数与 col_renames 函数
    • 支持用户额外传递私有 BOS 配置,中转上传数据集到公共 BOS 数据集中
    • 支持直接从 BOS 文件创建并导入数据集
    • 自动 Group ID 压缩与重排
    • Schema 校验失败时,现提供官方格式示例地址
    • 可以使用 len() 方法获取 Dataset 内数据的数量
  • Bug Fix:
    • 修复了当目的文件路径不存在时导出失败的问题
    • 修复了 col_append 可添加相同列名新列的问题
    • 从 Table 与 Dataset 中移除了 pydantic.BaseModel
    • 增加了更多单测

4、Trainer

  • 持续优化使用体验
    • EventHandler和Trainer绑定逻辑优化
  • 支持Model,Service

5、Cookbook

  • Dataset
  • Trainer
  • Prompt

V0.2.0发版内容

发版日期:2023-11-23

1、Resource API

  • 获取实体列表
  • 实体标注
  • 删除问答对
  • 创建数据清洗任务
  • 查看数据清洗任务详情
  • 删除数据清洗任务
  • 创建数据增强任务
  • 查看数据增强任务详情
  • 删除数据增强任务
  • 创建 prompt 模版
  • 获取 prompt 模版详情
  • 更新 prompt 模版
  • 删除 prompt 模版
  • 获取 prompt 列表

2、Experimental

  • Dataset
    • 优化在数据集中表示嵌套数组类似数据的方式,提高性能并使操作更加用户友好
    • 重构schema进行了重写,实现更准确的验证,避免了复杂的逻辑
    • 更新数据集表示方式
    • 数据集ETL(提取、转换、加载)
    • 支持在千帆数据源上发布,即使在上传后也可以
    • 使用online_data_process和千帆运算符(QianfanOperator)从SDK中创建ETL任务
    • 通过列表查看数据集数据而无需下载(list)
  • Trainer
    • LLMFinetune 支持大语言模型fine-tuning
    • Actions
      • DatasetLoad 数据集加载校验
      • ModelTrain 支持模型训练发起与watch
      • ModelPublish 支持模型发布
      • Deploy 支持自动化训练后转服务发布
    • event 支持Action事件回调

3、Cookbook

  • ChatCompletion
    • eb search
    • batch
评论
用户头像