西蒙哥西蒙哥  2021-05-27 06:33 Github 隐藏边栏 |   抢沙发  6 
文章评分 0 次,平均分 0.0

本课程全面概述了 Agentic RAG(智能体检索增强生成)。这是一种新兴的 AI 范式,其中大语言模型(LLM)在从外部资源提取信息时,能够自主规划后续步骤。与传统的“检索后阅读”的静态模式不同,Agentic RAG 涉及对 LLM 的迭代调用,并穿插工具或函数调用以及结构化输出。系统会评估结果、优化查询,并在需要时调用额外工具,持续循环直到获得满意的解决方案。

简介

本课涵盖内容:

  • 理解 Agentic RAG: 了解 AI 领域这一新兴范式,即 LLM 在从外部数据源提取信息时,能自主规划其下一步行动。
  • 掌握迭代式“生成-检查”模式(Maker-Checker Style): 理解 LLM 迭代调用的闭环过程,包括穿插的工具/函数调用和结构化输出,旨在提高准确性并处理格式错误的查询。
  • 探索实际应用: 识别 Agentic RAG 的优势场景,如准确性至上的环境、复杂的数据库交互以及扩展工作流。

学习目标

完成本课程后,您将了解/掌握:

  • 理解 Agentic RAG: 学习 LLM 在提取外部信息时自主规划步骤的新兴范式。
  • 迭代式生成-检查模式: 掌握通过迭代循环、工具调用和结构化输出来提升准确性的概念。
  • 掌握推理过程的主导权: 理解系统如何主导自身的推理过程,在不依赖预定义路径的情况下决定解决问题的方法。
  • 工作流: 了解智能体模型如何独立决定检索市场趋势报告、识别竞争对手数据、关联内部销售指标、综合发现并评估策略。
  • 迭代循环、工具集成与记忆: 学习系统如何依赖循环交互模式,并在不同步骤间保持状态和记忆,以避免重复循环并做出明智决策。
  • 处理失败模式与自我修复: 探索系统健壮的自我修复机制,包括迭代重新查询、使用诊断工具以及求助于人工监督。
  • 智能体的边界: 理解 Agentic RAG 的局限性,重点关注特定领域的自主性、对基础设施的依赖以及对护栏(Guardrails)的遵守。
  • 实际用例与价值: 识别 Agentic RAG 在高准确性需求、复杂数据库和长工作流中的应用价值。
  • 治理、透明度与信任: 了解治理和透明度的重要性,包括可解释的推理、偏差控制和人工监督。

什么是 Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) 是一种新兴的 AI 范式。在这种模式下,大语言模型(LLM)在从外部源提取信息时会自主规划后续步骤。不同于静态的“检索再阅读”模式,Agentic RAG 包含对 LLM 的多次迭代调用,其间穿插着工具/函数调用和结构化输出。系统会评估结果、精炼查询、按需调用更多工具,并重复此循环直到达成满意方案。这种迭代式的“生成-检查”模式提高了准确性,能处理格式错误的查询,并确保高质量的输出。

系统主动主导其推理过程。在最终确定答案前,它可以重写失败的查询,选择不同的检索方法,并整合多种工具(例如 Azure AI Search 中的向量搜索、SQL 数据库或自定义 API)。智能体系统的核心特征在于其主导推理过程的能力。传统的 RAG 实现依赖于预定义的路径,而智能体系统则根据所获信息的质量,自主决定步骤的先后顺序。

定义 Agentic RAG

Agentic RAG 是 AI 开发中的一种进阶范式,LLM 不仅仅是从外部数据源提取信息,还会自主规划行动方案。它不同于静态模式或刻板的提示词序列,而是一个包含迭代调用、工具使用和结构化输出的闭环。在每一步,系统都会评估已获得的结果,决定是否需要优化查询,并在必要时启用额外工具,循环往复直至解决问题。

这种迭代式操作旨在提高正确性,处理对结构化数据库(如 NL2SQL,自然语言转 SQL)的错误查询,并确保输出结果平衡且高质量。系统不再仅仅依赖于精心设计的提示词链(Prompt Chains),而是积极掌控推理。它可以重写无效查询,选择不同的检索策略,并整合向量搜索、SQL 或 API。这降低了对过度复杂编排框架的需求,一个简单的“调用 LLM → 使用工具 → 调用 LLM → ...”的循环就能产生复杂且有理有据的输出。

定义 Agentic RAG

主导推理过程

使一个系统具有“智能体(Agentic)”特征的区别性品质在于它主导自身推理过程的能力。传统的 RAG 实现通常依赖人类预设路径:通过思维链(Chain-of-thought)规定检索什么以及何时检索。而真正的智能体系统会内部决策如何处理问题。它不仅是在执行脚本,而是根据发现的信息质量自主确定步骤序列。

例如,在受命制定产品发布策略时,智能体模型不会只依赖一个写满研究和决策流程的提示词,而是独立决定:

  1. 使用 Bing Web Grounding 检索当前市场趋势报告。
  2. 利用 Azure AI Search 识别相关的竞争对手数据。
  3. 通过 Azure SQL Database 关联历史内部销售指标
  4. 通过 Azure OpenAI Service 编排,将发现的结果综合为一致的策略。
  5. 评估策略是否存在漏洞或矛盾,必要时发起新一轮检索。

所有这些步骤——优化查询、选择来源、迭代直到对答案“满意”——都由模型决定,而非人类预设。

迭代循环、工具集成与记忆

智能体系统依赖于一种循环交互模式:

  • 初始调用: 将用户目标(提示词)提交给 LLM。
  • 工具调用: 如果模型发现信息缺失或指令模糊,它会选择一种工具或检索方法(如 Azure AI Search 对私有数据的混合搜索,或结构化 SQL 调用)来获取更多上下文。
  • 评估与优化: 在查看返回数据后,模型判断信息是否足够。如果不足,它会优化查询、尝试不同工具或调整策略。
  • 重复直至满意: 循环持续到模型认为已具备足够的清晰度和证据来提供最终的、推理充分的回答。
  • 记忆与状态: 由于系统在各步骤间保持状态和记忆,它可以回顾之前的尝试及其结果,避免陷入死循环,并在推进过程中做出更明智的决策。

随着时间推移,这会产生一种理解力不断进化的感觉,使模型能够处理复杂的多步任务,而无需人类不断干预或重塑提示词。

处理失败模式与自我修复

Agentic RAG 的自主性还体现在强大的自我修复机制。当系统遇到死胡同(如检索到无关文档或遇到错误的查询格式)时,它可以:

  • 迭代与重新查询: 模型不会直接返回低质量响应,而是尝试新的搜索策略,重写数据库查询,或查找替代数据集。
  • 使用诊断工具: 系统可能会调用专门的函数来辅助调试其推理步骤,或确认检索数据的准确性。Azure AI Tracing 等工具对于实现稳健的可观测性和监控至关重要。
  • 人工干预回退: 对于高风险或反复失败的场景,模型可能会标记不确定性并请求人工指导。一旦人类提供反馈,模型可以在后续步骤中吸取教训。

这种动态方法确保模型能够不断改进,使其不再是一个“一锤子买卖”的系统,而是一个能在会话中从错误中学习的系统。

智能体的自我修复

智能体的边界

尽管在任务内部具有自主性,但 Agentic RAG 并不等同于通用人工智能(AGI)。其“智能”能力被局限在人类开发者提供的工具、数据源和策略范围内。它不能发明自己的工具,也无法跳出设定的领域边界。它擅长的是动态编排现有资源。其与高级 AI 形式的关键区别包括:

  • 特定领域的自主性: 专注于在已知领域内实现用户目标,采用查询重写等策略优化结果。
  • 基础设施依赖: 系统能力受限于开发者集成的工具和数据,无法在没有人类干预的情况下超越这些边界。
  • 遵守护栏: 伦理准则、合规规则和业务策略仍然至关重要。智能体的自由度始终受到安全措施和监督机制的约束。

实际用例与价值

Agentic RAG 在需要迭代优化和精准度的场景中大放异彩:

  • 准确性至上的环境: 在合规性检查、监管分析或法律研究中,智能体模型可以反复核实事实、咨询多个来源,直到产出经过充分审查的答案。
  • 复杂的数据库交互: 处理结构化数据时,查询经常失败或需要调整,系统可以使用 Azure SQL 或 Microsoft Fabric OneLake 自主优化查询。
  • 扩展工作流: 随着新信息的出现,长会话可以不断演进。Agentic RAG 能够持续整合新数据,根据对问题空间的深入了解转向不同策略。

治理、透明度与信任

随着系统在推理上变得更加自主,治理和透明度变得至关重要:

  • 可解释的推理: 模型可以提供审计追踪,展示其查询记录、咨询的来源以及得出结论的推理步骤。Azure AI Content Safety 和 Azure AI Tracing / GenAIOps 等工具可帮助维持透明度并降低风险。
  • 偏差控制与平衡检索: 开发者可以调整检索策略以确保考虑平衡、有代表性的数据源,并使用 Azure Machine Learning 等工具定期审计输出。
  • 人工监督与合规: 对于敏感任务,人工审查必不可少。Agentic RAG 不会在高风险决策中取代人类判断,而是通过提供更充分验证的选项来增强判断。

拥有能提供清晰行动记录的工具是必不可少的。如果没有它们,调试一个多步骤过程会非常困难。请参考以下来自 Literal AI(Chainlit 背后的公司)关于智能体运行的示例:

结论

Agentic RAG 代表了 AI 系统处理复杂、数据密集型任务的自然演进。通过采用循环交互模式、自主选择工具并持续优化查询,系统从静态的“指令跟随者”转变为更具适应性、具备上下文感知能力的“决策者”。虽然它仍受限于人类定义的基础设施和伦理准则,但这些智能体能力为企业和最终用户带来了更丰富、更动态且更有价值的 AI 交互体验。

本文来自投稿,不代表西蒙园立场,来源于Github,版权归原作者所有,欢迎分享本文,转载请保留出处!

西蒙哥
西蒙哥 关注:0    粉丝:0 最后编辑于:2026-04-20
这个人很懒,什么都没写

发表评论

表情 格式 链接 私密 签到

扫一扫二维码分享