智慧图问
插件功能
图片解析插件,主要功能为图片理解与识别,并对图片内容进行总结概述,输出用户可理解的自然语言文本描述(句子或段落)。
识别能力包含文字OCR解析、人物识别、植物识别、商品识别、车辆识别等等。其中,
- 文字OCR可对网页截图、办公文档、表格、题目公式、海报广告等进行解析;
- 人物识别包含演员、歌手、企业家等公众人物,可参考百度百科词条人物(不包含国内国际政要等敏感人物);
- 植物识别能力可识别常见的树木、花卉、农作物等;商品识别能力可输出常见商品名称;
- 车辆识别包含常见车型、品牌以及颜色等属性。另外,针对通用图片,本插件可输出简要图片内容描述,包含图片人物的表情动作描述、物品状态属性描述、景物风景描述等。满足智能AI应用在视觉感知能力的扩展与交互。
插件配置
可选择进行基础配置,填入提示词。
使用效果
此插件支持上传文件进行测试,如下所示:
支持上传jpg、jpeg、png、bmp、webp格式的文件,文档不得超过10M,仅支持单文件上传,以下为测试效果: