RAG VS Agent,如何选择最适合你的创建应用方式?

AI原生应用开发/技术交流

4月10日3432看过

对于刚接触大模型的朋友们可能对RAG和Agent有点陌生，上述两个方向被业内认为是能够充分发挥大模型潜力的应用方向。百度为大家提供了可视化、轻代码甚至零代码开发RAG、Agent的框架——App Builder，助力各个行业的从业者开发出属于自己的大模型App，从而减少负担，提高工作效率。那么RAG跟Agent到底是什么呢？我们应如何选择最适合自己的创建应用方式呢？

什么是RAG？

RAG（Retrieval Augmented Generation，检索增强生成），由字面可以看出是通过检索增强大模型的生成能力。RAG主要由两个模块构成：

检索模块，计算用户问题与知识库中数据的相似度，并返回相似度最高的k（这里的k是可以由人工指定的）条数据；
生成模块，将用户的问题与检索到的数据返回给大模型，大模型再根据给定参考数据生成问题答案返回给用户。

相比大模型另一条道路——微调，RAG具有以下优点：

微调需要较高的门槛（代码能力）与算力支撑，RAG则易于零基础人群上手，只需要用户提供知识（大模型的参考数据即可）并调用API即可；
微调的大模型更新所需知识需要进行再次微调，每次更新知识都需要创建数据集并重新调用算力微调，而RAG则只需要向知识库上传文档即可，不需要算力支撑。
微调大模型在面对微调时数据集未曾出现的问题时会出现大模型幻觉现象（即一本正经说假话），而RAG说的每句话都是通过参考文献生成的，即使在面对知识库中未曾涉及的问题也可以通过设计prompt（提示）来规避大模型幻觉。