基于【知识库、数据库】快速打造应用
AI原生应用开发/技术交流
2024.07.10566看过
基于【知识库、数据库】快速打造应用
1.知识库导入
进入千帆原生平台,点击创建知识库,可以看到:

资源选择有:
-
AppBuilder
-
导入文本文档数据
-
导入知识问答数据
-
导入网页数据源
-
-
BaiDu ElasticSearch
数据存储,其中导入数据有2种:
-
文档上传
-
BOS数据
2.几种知识库创建
-
文档上传格式
例如【知识库-BeautifulSoup文档】,上传PDF文档,自动切片:

-
URL链接创建
例如使用故宫官网 https://www.dpm.org.cn/Home.html ,创建【知识库-故宫建筑】

3.自定义切片
自定义切片,需要反复测试,结构化文档,例如【古诗词数据库】

分隔符开始选择省略号,但是省略号存在英文、中文两种,使用都不奏效。最终多种测试,使用!才堪堪达到效果。
最新更新后,有更多的切片方式。

可见有多重解析、切片策略。

此外模板配置也有许多,比以前大大增强。
4.数据库创建
上传数据文件, 并简要描述数据内容。

最终如下所示:

据此可创建应用关联数据库进行增删改查操作。
5.相关应用
-
知识库应用
「BeautifulSoup助手」:https://appbuilder.baidu.com/s/7R1jyCTk
「飞桨开发者助手」:https://appbuilder.baidu.com/s/fxGReCGJ
「动手学深度学习助手」:https://appbuilder.baidu.com/s/cKkFmmBo
「PyTorch学习助手」:https://appbuilder.baidu.com/s/L5SOIves
「sklearn学习助手」:https://appbuilder.baidu.com/s/UQycYzCF
-
数据库操作
6.总结
-
文档支持单次上传文档数量为100个;支持.doc,.txt,.docx,.pdf,.ppt,pptx六种格式;txt 文件不能超过10MB, docx、pdf、doc、ppt、pptx 文件不能超过50MB且不能超过1000页。特别丰富,数量也多。
-
URL解析非常强大,省去了爬取知识库的痛苦。
-
数据库操作代码很精准,需要注意的是匹配方面要说清楚,不然精确匹配会找不到内容。
评论
