导语:
什么是 AI 智能体?有哪些不同类型的智能体?
哪些应用场景最适合 AI 智能体?它们能为我们提供怎样的帮助?
设计智能体解决方案时,有哪些基本的构建模块?
简介 (Introduction)
本节课涵盖以下内容:
- 什么是 AI 智能体?有哪些不同类型的智能体?
- 哪些应用场景最适合 AI 智能体?它们能为我们提供怎样的帮助?
- 设计智能体解决方案时,有哪些基本的构建模块?
学习目标 (Learning Goals)
完成本节课后,您将能够:
- 理解 AI 智能体的概念,及其与其他 AI 解决方案的区别。
- 最高效地应用 AI 智能体。
- 为用户和客户高效地设计智能体解决方案。
定义 AI 智能体与 AI 智能体的类型 (Defining AI Agents and Types of AI Agents)
什么是 AI 智能体?
AI 智能体是一种系统,它通过赋予大型语言模型(LLM)访问工具和知识的权限来扩展其能力,从而使 LLM 能够执行操作。
让我们将这个定义拆解为更小的部分来理解:
- 系统 (System) - 重要的是不要将智能体仅仅视为单个组件,而应将其视为由多个组件构成的系统。在基础层面上,AI 智能体的组件包括:
- 环境 (Environment) - AI 智能体运行的特定空间。例如,如果我们有一个旅行预订 AI 智能体,其环境可能就是该智能体用来完成任务的旅行预订系统。
- 传感器 (Sensors) - 环境包含信息并提供反馈。AI 智能体使用传感器来收集和解释有关环境当前状态的信息。在旅行预订智能体的示例中,旅行预订系统可以提供诸如酒店可用性或航班价格等信息。
- 执行器 (Actuators) - 一旦 AI 智能体接收到环境的当前状态,针对当前任务,智能体会决定执行什么操作来改变环境。对于旅行预订智能体来说,这可能是为用户预订一间空房。

- 大型语言模型 (Large Language Models, LLMs) - 智能体的概念在 LLM 出现之前就已经存在。使用 LLM 构建 AI 智能体的优势在于它们解释人类语言和数据的能力。这种能力使 LLM 能够解释环境信息并制定改变环境的计划。
- 执行操作 (Perform Actions) - 在 AI 智能体系统之外,LLM 局限于基于用户提示生成内容或信息的场景。而在 AI 智能体系统内部,LLM 可以通过解释用户的请求并使用其环境中的可用工具来完成实际任务。
- 访问工具 (Access To Tools) - LLM 可以访问哪些工具取决于:1) 它所运行的环境;2) AI 智能体的开发者。在我们的旅行智能体示例中,智能体的工具受限于预订系统中可用的操作,或者开发者可以将智能体的工具访问权限限制为仅限预订航班。
- 记忆与知识 (Memory+Knowledge) - 在用户与智能体对话的语境中,记忆可以是短期的。从长期来看,除了环境提供的信息外,AI 智能体还可以从其他系统、服务、工具甚至其他智能体中检索知识。在旅行智能体示例中,这些知识可以是存储在客户数据库中的有关用户旅行偏好的信息。
不同类型的智能体 (The different types of agents)
既然我们对 AI 智能体有了大致的定义,让我们来看看一些具体的智能体类型,以及它们将如何应用于“旅行预订 AI 智能体”这一场景。
| 智能体类型 (Agent Type) | 描述 (Description) | 示例 (Example) |
| 简单反射型智能体 (Simple Reflex Agents) | 基于预定义的规则执行即时操作。 | 旅行智能体解析电子邮件的上下文,并将有关旅行的投诉转发给客户服务部门。 |
| 基于模型的反射型智能体 (Model-Based Reflex Agents) | 基于世界模型及该模型发生的变化来执行操作。 | 旅行智能体基于历史定价数据,优先处理价格出现大幅变动的路线。 |
| 基于目标的智能体 (Goal-Based Agents) | 通过解析目标并确定达成该目标所需的操作来制定计划。 | 旅行智能体通过确定从当前位置到目的地的必要交通安排(汽车、公共交通、航班)来预订行程。 |
| 基于效用的智能体 (Utility-Based Agents) | 考虑偏好并通过数值量化权衡,以确定如何最好地实现目标。 | 旅行智能体在预订旅行时权衡便利性与成本,从而实现效用最大化。 |
| 学习型智能体 (Learning Agents) | 通过响应反馈并相应地调整操作,随着时间的推移不断改进。 | 旅行智能体利用旅行后调查中的客户反馈来对未来的预订进行调整改进。 |
| 分层智能体 (Hierarchical Agents) | 在多层级系统中包含多个智能体,高级别智能体将任务分解为子任务,交由低级别智能体完成。 | 旅行智能体通过将任务划分为子任务(例如,取消特定的预订)来取消行程,让低级别智能体完成这些子任务,并向高级别智能体报告。 |
| 多智能体系统 (Multi-Agent Systems, MAS) | 多个智能体通过合作或竞争的方式独立完成任务。 | 合作: 多个智能体分别预订酒店、航班和娱乐等特定的旅行服务。
竞争: 多个智能体管理并竞争共享的酒店预订日历,以为客户预订酒店房间。 |
何时使用 AI 智能体 (When to Use AI Agents)
在前面的部分中,我们使用了“旅行智能体”的用例来解释不同类型的智能体如何用于旅行预订的不同场景。我们将在整个课程中继续使用此应用案例。
让我们来看看 AI 智能体最适合处理的用例类型:

- 开放式问题 (Open-Ended Problems) - 允许 LLM 决定完成任务所需的步骤,因为这些步骤无法总是硬编码(Hardcode)到工作流中。
- 多步流程 (Multi-Step Processes) - 具有一定复杂度的任务,其中 AI 智能体需要在多个交互轮次中使用工具或信息,而不是简单的单次检索。
- 随时间改进 (Improvement Over Time) - 智能体可以通过接收来自其环境或用户的反馈来随时间推移不断改进,从而提供更好效用的任务。
我们将在“构建可信 AI 智能体”一课中探讨使用 AI 智能体的更多注意事项。
智能体解决方案基础 (Basics of Agentic Solutions)
智能体开发 (Agent Development)
设计 AI 智能体系统的第一步是定义工具、操作和行为。在本课程中,我们将重点使用 Azure AI 智能体服务 (Azure AI Agent Service) 来定义我们的智能体。它提供以下功能:
- 选择开放模型,如 OpenAI、Mistral 和 Llama。
- 通过 Tripadvisor 等提供商使用受授权保护的数据。
- 使用标准化的 OpenAPI 3.0 工具。
智能体模式 (Agentic Patterns)
我们通过提示词(Prompts)与 LLM 进行通信。鉴于 AI 智能体半自主的特性,在环境发生变化后,手动重新提示 LLM 并不总是可行或必要的。因此,我们使用智能体模式 (Agentic Patterns),它允许我们以一种更具扩展性的方式,在多个步骤中对 LLM 进行提示。
本课程将按当前流行的一些智能体模式来进行划分与讲解。
智能体框架 (Agentic Frameworks)
智能体框架允许开发者通过代码实现智能体模式。这些框架提供了模板、插件和工具,以实现更好的 AI 智能体协作。这些优势为更好地观察和排除 AI 智能体系统的故障提供了能力保障。
在本课程中,我们将探索使用 Microsoft 智能体框架 (MAF) 来构建可投入生产的 AI 智能体。
你可能也喜欢
- ♥ 工具使用设计模式01/19
- ♥ 智能体检索增强生成05/27
- ♥ 智能体的上下文工程09/06
- ♥ AI 智能体中的元认知 (Metacognition in AI Agents)05/24
- ♥ 探索微软智能代理框架12/26
- ♥ 构建值得信赖的 AI 智能体04/19

