2
【千帆SDK专属更新帖】最新V0.2.6发版公告
大模型开发/产品动态
- LLM
- API
- 大模型推理
1月3日8818看过
千帆SDK当前已经开源到Github,并将持续更新迭代,欢迎各位开发者使用订阅,如果有任何问题可以在Github以及评论区提出!
请大家点击链接并加🌟:http://github.com/baidubce/bce-qianfan-sdk
V0.2.6发版公告
发版日期:2024-1-5
1、Resource
-
模型管理-创建模型评估任务
-
去掉入参scoreModes
-
去掉datasetName
-
新增入参
-
resultDatasetStorageType
-
resultDatasetStorageId
-
resultDatasetRawPath
-
-
-
requestor优化重试机制
-
增加可配置随机重试/指数回避重试
-
增加可配置错误码重试
-
-
增加Service.list 用于查询服务列表
-
iam鉴权统一
2、Trainer
-
增加训练超参*
3、Evaluation
-
支持本地评估LocalEvaluators
4、Cli
-
新增model list
-
新增dataset up/down
-
新增dataset 批量刷库
-
新增trainer 发起任务
5、Tool
-
qianfan Tool->langchain Tool转化
6、cookbook
-
新增evaluation cookbook
-
dataset cookbook 增加Model批量推理示例
V0.2.5发版内容
发版日期:2023-12-28
1、Resource
-
requestor优化重试机制,增加可配置重试策略
-
文生图SD新增超参
-
iam鉴权优化
2、Dataset:
-
优化批量刷库性能,能够match实际设定的QPS
-
优化错误重试
-
增加刷库日志
3、Tool
-
baidu_search 搜索增强tool
4、Trainer
-
LLMFinetune接入Evaluation
5、Cli
-
新增命令行工具qianfan
-
支持chat/completion/text2image
-
支持dataset up/down
-
支持dataset批量刷库
附:目录变更
components -> common
V0.2.4发版内容
发版日期:2023-12-21
1、Evaluation
-
Evaluation 基础框架上线
-
支持千帆平台评估
2、Dataset
-
加入
test_using_llm
方法,允许用户直接在特定数据集上使用Model
或者Service
对象运行 -
支持异步清洗
3、Model & Service
-
添加
batch_run_on_qianfan
方法
4、Trainer
-
支持ERNIE-Bot-turbor-0922,0516即将下线
-
Action 适配 Evaluation
5、resource
-
加入请求Latency 统计
-
ChatCompletion、Completion stream增加首Token 时延
-
ebturbo新增tool、tool_choice,支持baidu_search
-
EB3.5 4.0新增tool_choice
-
新增Yi_34B_Chat 预置ChatCompletion 服务
-
对齐API model值(EB-turbo-AppBuilder、ERNIE-Bot-8K)
-
Plugin增加一言插件支持(eChart、ChatFile、ImageAI)
6、Tool
-
转换 from Langchain to Tool
-
ebturbo搜索增强Tool
7、cookbook
-
增加finetune数据多轮对话样例
-
批量推理
V0.2.3发版内容
发版日期:2023-12-14
1、Resources
-
新增ChatLaw预置模型服务
2、Dataset
-
支持通过压缩包批量上传数据文件到千帆
-
支持按文件为粒度导入泛文本数据
3、Tool
-
新增Tool框架
-
from langchain Tool转换
-
常用工具拓展
-
wikipedia
-
arxiv
-
duckduckgo
-
4、Trainer
优化体验,修复已知问题
-
DeployConfig增加poolType默认参数
-
PeftMethod改为枚举变量
-
TrainAction优化日志显示信息
-
新增日志link
-
vdl link延迟打印
-
5、Cookbook
-
dataset Operator
-
千帆平台算子补充
-
6、其它
-
修复了 Console Requestor 重试时的 URL 路径错误拼接问题
-
Requestor 支持从配置获取重试配置
-
eval -> console cookbook
V0.2.2发版内容
发版日期:2023-12-07
1、Resources API
-
增加
max_output_tokens
字段支持,可以配置输出的最大token数,支持EB、EB-8k
2、Trainer
-
action支持可恢复resume()
-
fix deploy流程
3、Dataset
-
load
方法支持直接从 Huggingface Dataset 导入 -
从文件夹批量导入数据集的支持(严格意义上的)
-
嵌套目录
-
4、Cookbook
-
SequenceChain
-
eval -> console cookbook
V0.2.1发版内容
发版日期:2023-11-30
1、Resources
-
新增预置模型服务
-
request_Id支持
-
requestor 打印信息优化
2、Component
-
Hub
-
Prompt 上线
3、Dataset
-
新功能:
-
Dataset 同时支持数组模式表示与 Table 模式表示
-
新增
Insert
类函数与col_renames
函数 -
支持用户额外传递私有 BOS 配置,中转上传数据集到公共 BOS 数据集中
-
支持直接从 BOS 文件创建并导入数据集
-
自动 Group ID 压缩与重排
-
Schema 校验失败时,现提供官方格式示例地址
-
可以使用
len()
方法获取 Dataset 内数据的数量
-
-
Bug Fix:
-
修复了当目的文件路径不存在时导出失败的问题
-
修复了
col_append
可添加相同列名新列的问题 -
从 Table 与 Dataset 中移除了
pydantic.BaseModel
-
增加了更多单测
-
4、Trainer
-
持续优化使用体验
-
EventHandler和Trainer绑定逻辑优化
-
-
支持Model,Service
5、Cookbook
-
Dataset
-
Trainer
-
Prompt
V0.2.0发版内容
发版日期:2023-11-23
1、Resource API
-
获取实体列表
-
实体标注
-
删除问答对
-
创建数据清洗任务
-
查看数据清洗任务详情
-
删除数据清洗任务
-
创建数据增强任务
-
查看数据增强任务详情
-
删除数据增强任务
-
创建 prompt 模版
-
获取 prompt 模版详情
-
更新 prompt 模版
-
删除 prompt 模版
-
获取 prompt 列表
2、Experimental
-
Dataset
-
优化在数据集中表示嵌套数组类似数据的方式,提高性能并使操作更加用户友好
-
重构schema进行了重写,实现更准确的验证,避免了复杂的逻辑
-
更新数据集表示方式
-
数据集ETL(提取、转换、加载)
-
支持在千帆数据源上发布,即使在上传后也可以
-
使用online_data_process和千帆运算符(QianfanOperator)从SDK中创建ETL任务
-
通过列表查看数据集数据而无需下载(list)
-
-
Trainer
-
LLMFinetune 支持大语言模型fine-tuning
-
Actions
-
DatasetLoad 数据集加载校验
-
ModelTrain 支持模型训练发起与watch
-
ModelPublish 支持模型发布
-
Deploy 支持自动化训练后转服务发布
-
-
event 支持Action事件回调
-
3、Cookbook
-
ChatCompletion
-
eb search
-
batch
-
评论