AI Agent 简介

AI Agent,中文称为人工智能Agent,是一种能够感知环境、进行决策并执行动作的智能实体。不同于传统的人工智能,AI Agent具备更高的自主性和智能化水平。

https://oss-ata.alibaba.com/article/2024/10/0cfa64d6-5dad-475a-99a1-33e939cf46bf.jpeg?x-oss-process=image/resize,m_lfit,w_1600/auto-orient,1/quality,Q_80/format,avif/ignore-error,1

Agent的核心功能可以概括为三个循环步骤:感知、规划和行动。

1.感知(Perception):Agent收集环境中的信息并提取出重要知识。

2.规划(Planning:基于目标制定决策过程。

3.行动(Action):根据环境和规划执行具体的行为。

这与辩证唯物主义认识论相似,即通过实践不断深化对独立客观世界的认识,Agent也在知行合一中进化。

Agent在工程侧的实现一般分为如下几个模块:推理、记忆、工具、行动

https://oss-ata.alibaba.com/article/2024/10/3737da24-c379-47e0-8416-a9b76e4127aa.png?x-oss-process=image/resize,m_lfit,w_1600/auto-orient,1/quality,Q_80/format,avif/ignore-error,1

2 AI Agent推理模式

AI Agent推理模式用于指导人工智能系统进行逻辑推理和问题解决,其核心目标是通过系统化的思考步骤来提高问题解决的准确性和效率。这些推理模式已经被广泛应用到智能体设计中,以增强它们在复杂任务中的表现。

在探讨最近几个月中AI Agent的突破与创新之前,先来了解几种常见的推理模式,这些模式在单智能体和多智能体系统中的应用各有不同和独特的优势。

COT (Chain of Thought, 思维链)

思维链是一种推理策略,旨在让模型通过分步推理来解决复杂问题。这种方法模拟人类的思维过程,以提高模型的解题能力和准确性。

具体做法是:在回答复杂问题时,模型不是直接给出答案,而是通过一系列的中间步骤逐步推理出答案。

零样本COT/少样本COT

CoT可以是Few-shot CoT,其中包含几个逐步推理的示例,也可以是Zero-shot CoT,只包含引导模型进行逐步推理的文本指令。