logo
1

基于【知识库、数据库】快速打造应用

基于【知识库、数据库】快速打造应用

1.知识库导入

进入千帆原生平台,点击创建知识库,可以看到:
资源选择有:
  • AppBuilder
    • 导入文本文档数据
    • 导入知识问答数据
    • 导入网页数据源
  • BaiDu ElasticSearch
数据存储,其中导入数据有2种:
  • 文档上传
  • BOS数据

2.几种知识库创建

  • 文档上传格式
例如【知识库-BeautifulSoup文档】,上传PDF文档,自动切片:
  • URL链接创建
例如使用故宫官网 https://www.dpm.org.cn/Home.html ,创建【知识库-故宫建筑

3.自定义切片

自定义切片,需要反复测试,结构化文档,例如【古诗词数据库】
分隔符开始选择省略号,但是省略号存在英文、中文两种,使用都不奏效。最终多种测试,使用!才堪堪达到效果。
最新更新后,有更多的切片方式。
可见有多重解析、切片策略。
此外模板配置也有许多,比以前大大增强。

4.数据库创建

上传数据文件, 并简要描述数据内容。
最终如下所示:
据此可创建应用关联数据库进行增删改查操作。

5.相关应用

  • 知识库应用
「古诗词万事通」:https://appbuilder.baidu.com/s/XgDkz3Wy
「BeautifulSoup助手」:https://appbuilder.baidu.com/s/7R1jyCTk
「纪念堂小助手」:https://appbuilder.baidu.com/s/ZQDUex1o
「飞桨开发者助手」:https://appbuilder.baidu.com/s/fxGReCGJ
「故宫小助手」:https://appbuilder.baidu.com/s/PZbfZhJC
「咖啡小达人」:https://appbuilder.baidu.com/s/h9KC50hR
「动手学深度学习助手」:https://appbuilder.baidu.com/s/cKkFmmBo
「PyTorch学习助手」:https://appbuilder.baidu.com/s/L5SOIves
「sklearn学习助手」:https://appbuilder.baidu.com/s/UQycYzCF
  • 数据库操作
「图书小助手」:https://appbuilder.baidu.com/s/lvVKIUWb

6.总结

  • 文档支持单次上传文档数量为100个;支持.doc,.txt,.docx,.pdf,.ppt,pptx六种格式;txt 文件不能超过10MB, docx、pdf、doc、ppt、pptx 文件不能超过50MB且不能超过1000页。特别丰富,数量也多。
  • URL解析非常强大,省去了爬取知识库的痛苦。
  • 数据库操作代码很精准,需要注意的是匹配方面要说清楚,不然精确匹配会找不到内容。
评论
用户头像