本课程全面概述了 Agentic RAG(智能体检索增强生成)。这是一种新兴的 AI 范式,其中大语言模型(LLM)在从外部资源提取信息时,能够自主规划后续步骤。与传统的“检索后阅读”的静态模式不同,Agentic RAG 涉及对 LLM 的迭代调用,并穿插工具或函数调用以及结构化输出。系统会评估结果、优化查询,并在需要时调用额外工具,持续循环直到获得满意的解决方案。
简介
本课涵盖内容:
- 理解 Agentic RAG: 了解 AI 领域这一新兴范式,即 LLM 在从外部数据源提取信息时,能自主规划其下一步行动。
- 掌握迭代式“生成-检查”模式(Maker-Checker Style): 理解 LLM 迭代调用的闭环过程,包括穿插的工具/函数调用和结构化输出,旨在提高准确性并处理格式错误的查询。
- 探索实际应用: 识别 Agentic RAG 的优势场景,如准确性至上的环境、复杂的数据库交互以及扩展工作流。
学习目标
完成本课程后,您将了解/掌握:
- 理解 Agentic RAG: 学习 LLM 在提取外部信息时自主规划步骤的新兴范式。
- 迭代式生成-检查模式: 掌握通过迭代循环、工具调用和结构化输出来提升准确性的概念。
- 掌握推理过程的主导权: 理解系统如何主导自身的推理过程,在不依赖预定义路径的情况下决定解决问题的方法。
- 工作流: 了解智能体模型如何独立决定检索市场趋势报告、识别竞争对手数据、关联内部销售指标、综合发现并评估策略。
- 迭代循环、工具集成与记忆: 学习系统如何依赖循环交互模式,并在不同步骤间保持状态和记忆,以避免重复循环并做出明智决策。
- 处理失败模式与自我修复: 探索系统健壮的自我修复机制,包括迭代重新查询、使用诊断工具以及求助于人工监督。
- 智能体的边界: 理解 Agentic RAG 的局限性,重点关注特定领域的自主性、对基础设施的依赖以及对护栏(Guardrails)的遵守。
- 实际用例与价值: 识别 Agentic RAG 在高准确性需求、复杂数据库和长工作流中的应用价值。
- 治理、透明度与信任: 了解治理和透明度的重要性,包括可解释的推理、偏差控制和人工监督。
什么是 Agentic RAG?
Agentic Retrieval-Augmented Generation (Agentic RAG) 是一种新兴的 AI 范式。在这种模式下,大语言模型(LLM)在从外部源提取信息时会自主规划后续步骤。不同于静态的“检索再阅读”模式,Agentic RAG 包含对 LLM 的多次迭代调用,其间穿插着工具/函数调用和结构化输出。系统会评估结果、精炼查询、按需调用更多工具,并重复此循环直到达成满意方案。这种迭代式的“生成-检查”模式提高了准确性,能处理格式错误的查询,并确保高质量的输出。
系统主动主导其推理过程。在最终确定答案前,它可以重写失败的查询,选择不同的检索方法,并整合多种工具(例如 Azure AI Search 中的向量搜索、SQL 数据库或自定义 API)。智能体系统的核心特征在于其主导推理过程的能力。传统的 RAG 实现依赖于预定义的路径,而智能体系统则根据所获信息的质量,自主决定步骤的先后顺序。
定义 Agentic RAG
Agentic RAG 是 AI 开发中的一种进阶范式,LLM 不仅仅是从外部数据源提取信息,还会自主规划行动方案。它不同于静态模式或刻板的提示词序列,而是一个包含迭代调用、工具使用和结构化输出的闭环。在每一步,系统都会评估已获得的结果,决定是否需要优化查询,并在必要时启用额外工具,循环往复直至解决问题。
这种迭代式操作旨在提高正确性,处理对结构化数据库(如 NL2SQL,自然语言转 SQL)的错误查询,并确保输出结果平衡且高质量。系统不再仅仅依赖于精心设计的提示词链(Prompt Chains),而是积极掌控推理。它可以重写无效查询,选择不同的检索策略,并整合向量搜索、SQL 或 API。这降低了对过度复杂编排框架的需求,一个简单的“调用 LLM → 使用工具 → 调用 LLM → ...”的循环就能产生复杂且有理有据的输出。

主导推理过程
使一个系统具有“智能体(Agentic)”特征的区别性品质在于它主导自身推理过程的能力。传统的 RAG 实现通常依赖人类预设路径:通过思维链(Chain-of-thought)规定检索什么以及何时检索。而真正的智能体系统会内部决策如何处理问题。它不仅是在执行脚本,而是根据发现的信息质量自主确定步骤序列。
例如,在受命制定产品发布策略时,智能体模型不会只依赖一个写满研究和决策流程的提示词,而是独立决定:
- 使用 Bing Web Grounding 检索当前市场趋势报告。
- 利用 Azure AI Search 识别相关的竞争对手数据。
- 通过 Azure SQL Database 关联历史内部销售指标。
- 通过 Azure OpenAI Service 编排,将发现的结果综合为一致的策略。
- 评估策略是否存在漏洞或矛盾,必要时发起新一轮检索。
所有这些步骤——优化查询、选择来源、迭代直到对答案“满意”——都由模型决定,而非人类预设。

迭代循环、工具集成与记忆
智能体系统依赖于一种循环交互模式:
- 初始调用: 将用户目标(提示词)提交给 LLM。
- 工具调用: 如果模型发现信息缺失或指令模糊,它会选择一种工具或检索方法(如 Azure AI Search 对私有数据的混合搜索,或结构化 SQL 调用)来获取更多上下文。
- 评估与优化: 在查看返回数据后,模型判断信息是否足够。如果不足,它会优化查询、尝试不同工具或调整策略。
- 重复直至满意: 循环持续到模型认为已具备足够的清晰度和证据来提供最终的、推理充分的回答。
- 记忆与状态: 由于系统在各步骤间保持状态和记忆,它可以回顾之前的尝试及其结果,避免陷入死循环,并在推进过程中做出更明智的决策。
随着时间推移,这会产生一种理解力不断进化的感觉,使模型能够处理复杂的多步任务,而无需人类不断干预或重塑提示词。
处理失败模式与自我修复
Agentic RAG 的自主性还体现在强大的自我修复机制。当系统遇到死胡同(如检索到无关文档或遇到错误的查询格式)时,它可以:
- 迭代与重新查询: 模型不会直接返回低质量响应,而是尝试新的搜索策略,重写数据库查询,或查找替代数据集。
- 使用诊断工具: 系统可能会调用专门的函数来辅助调试其推理步骤,或确认检索数据的准确性。Azure AI Tracing 等工具对于实现稳健的可观测性和监控至关重要。
- 人工干预回退: 对于高风险或反复失败的场景,模型可能会标记不确定性并请求人工指导。一旦人类提供反馈,模型可以在后续步骤中吸取教训。
这种动态方法确保模型能够不断改进,使其不再是一个“一锤子买卖”的系统,而是一个能在会话中从错误中学习的系统。

智能体的边界
尽管在任务内部具有自主性,但 Agentic RAG 并不等同于通用人工智能(AGI)。其“智能”能力被局限在人类开发者提供的工具、数据源和策略范围内。它不能发明自己的工具,也无法跳出设定的领域边界。它擅长的是动态编排现有资源。其与高级 AI 形式的关键区别包括:
- 特定领域的自主性: 专注于在已知领域内实现用户目标,采用查询重写等策略优化结果。
- 基础设施依赖: 系统能力受限于开发者集成的工具和数据,无法在没有人类干预的情况下超越这些边界。
- 遵守护栏: 伦理准则、合规规则和业务策略仍然至关重要。智能体的自由度始终受到安全措施和监督机制的约束。
实际用例与价值
Agentic RAG 在需要迭代优化和精准度的场景中大放异彩:
- 准确性至上的环境: 在合规性检查、监管分析或法律研究中,智能体模型可以反复核实事实、咨询多个来源,直到产出经过充分审查的答案。
- 复杂的数据库交互: 处理结构化数据时,查询经常失败或需要调整,系统可以使用 Azure SQL 或 Microsoft Fabric OneLake 自主优化查询。
- 扩展工作流: 随着新信息的出现,长会话可以不断演进。Agentic RAG 能够持续整合新数据,根据对问题空间的深入了解转向不同策略。
治理、透明度与信任
随着系统在推理上变得更加自主,治理和透明度变得至关重要:
- 可解释的推理: 模型可以提供审计追踪,展示其查询记录、咨询的来源以及得出结论的推理步骤。Azure AI Content Safety 和 Azure AI Tracing / GenAIOps 等工具可帮助维持透明度并降低风险。
- 偏差控制与平衡检索: 开发者可以调整检索策略以确保考虑平衡、有代表性的数据源,并使用 Azure Machine Learning 等工具定期审计输出。
- 人工监督与合规: 对于敏感任务,人工审查必不可少。Agentic RAG 不会在高风险决策中取代人类判断,而是通过提供更充分验证的选项来增强判断。
拥有能提供清晰行动记录的工具是必不可少的。如果没有它们,调试一个多步骤过程会非常困难。请参考以下来自 Literal AI(Chainlit 背后的公司)关于智能体运行的示例:

结论
Agentic RAG 代表了 AI 系统处理复杂、数据密集型任务的自然演进。通过采用循环交互模式、自主选择工具并持续优化查询,系统从静态的“指令跟随者”转变为更具适应性、具备上下文感知能力的“决策者”。虽然它仍受限于人类定义的基础设施和伦理准则,但这些智能体能力为企业和最终用户带来了更丰富、更动态且更有价值的 AI 交互体验。
你可能也喜欢
- ♥ AI 智能体协议:MCP, A2A 与 NLWeb09/18
- ♥ AI 智能体的可观测性与评估03/31
- ♥ 智能体的上下文工程09/06
- ♥ AI 智能体设计原则01/18
- ♥ AI 智能体中的元认知 (Metacognition in AI Agents)05/24
- ♥ 探索 AI Agent(智能体)框架04/26

