logo
1

花费76.42利用预置数据集对【对话引擎方案】复现(包括SFT,发布,及预测)

使用的是数据集管理中的预置数据集:FinCUGE_FinESE。
它是金融事件主体抽取数据集,该数据集包含11752条数据,验证集包含1464条数据。
该数据集的目的是从新闻预料中。抽取特定事件类型的主体,用来对对话式大模型进行调优。
样本数据示例:
问题:抽取以下新闻中涉嫌非法集资事件的主体信息。
9月27日消息,此前宣布展期的饭饭金服又有新进展,浙江省嘉兴市公安局南湖区分局发布通报称,对饭饭投资管理(嘉兴)有限公司以涉嫌非法集资立案侦査
回答:涉嫌非法集资事件描述的金融主体是饭饭投资管理(嘉兴)有限公司。
参照课程示例,利用该数据集,对于大模型使用SFT(有监督微调)来进行模型精调,使得大模型有更好的金融新闻事件的主体抽取能力。操作非常便捷,在模型精调板块SFT页面下,依照需求创建SFT任务。
这里训练配置使用的是默认,基础模型是ERNIE-Bot-turbo,版本是0725,由于没有LORA使用的是全量更新,参数配置也是默认。
训练的时长使用了31分钟,评估结果显示ROGUE-1及ROGUE-L的指标表现不错,消耗了48.42,训练完之后再我的模型界面,对于大模型进行部署,操作也非常的简单。
花了大概28块钱部署了我SFT精调之后的大模型,部署到发布的事件大概是15分钟左右,之后就可以再我的服务界面看到部署后的大模型服务。
调用也非常简便,可以配置到应用接入板块的自建应用下,通过常规接口调用的方式调用即可。
也可以在体验中心,直接在我的服务下面选择已经SFT精调过的大模型,直接测试结果,这里使用测试数据集直接验证对比一下SFT前后的ERNIE-bot-Turbo。
SFT精调后的模型回答的非常简洁且精准。
评论
用户头像