RAG 学习笔记（七）

2024-01-24 本文已影响0人啊阿伟啊

RAG 中的 Agent

Agent 本身就是一个大的话题，本文只讨论 RAG 涉及的相关内容

Agent 是使用 LLM 进行推理，为其提供一系列工具完成一个任务。

工具包括一系列定义好的函数，比如：代码函数、外部API、其他的 Agent。

OpenAI 助理基本上实现了很多工具供 LLM 选择，比如：

函数调用可以将自然语言转换为对外部工具、数据库查询的API调用

LlamaIndex 中的 OpenAIAgent ，将函数调用与 ChatEngine 和 QueryEngine 结合起来，提供了基于知识和上下文感知的对话功能，并能够在单轮对话中进行多次 OpenAI 函数调用，带来了智能 Agent 的能力。

多文档 Agent 包括：
- 对每个文档初始化一个 Agent (OpanAIAgent)，可以完成文档总结和问答
- 一个顶级 Agent，负责将查询路由到文档 Agent 和进行最后回答的合成
文档 Agent 有两个工具：向量索引和摘要索引，根据查询决定使用哪个工具
对于顶级 Agent，所有的文档 Agent 都是工具

优点：

缺点

对于大型的多文档存储，作者建议简化架构，使其具有可扩展性。

内容响应合成是 RAG pipeline 的最后一步，根据检索到的上下文内容和用户原始的查询，生成最后的响应内容。

主要合成响应内容的高级方法有：

详细可以查看 LlamaIndex 文档的介绍：Response Synthesizer