智能体研究综述
AI Agents and Agentic Developments and prospects of AI
CONTENTS
01
AI Agents 与 Agentic AI 的区别
02
AI Agents 的发展基础与特点
03
Agentic AI 的关键架构改进
04
AI Agents 与 Agentic AI 面临的挑战
05
解决堵点问题的 10 大技术路径
06
未来发展趋势
01.AI Agents与Agentic AI的区别
AI Agents
以大模型为基础执行特定任务的自主体,适用于客服自动化、邮件分类、日程助手等单一任务自动化处理场景,具有自主性、任务专一性、反应性与适应性三大核心特征。
Agentic AI
由多个协作智能体组成的系统,具备复杂任务拆解、自主决策和多步骤协同能力,更接近人类的组织式智能,典型应用于多智能体研究助手、智能机器人协作等场景。
TABLE l: Key Differences Between AI Agents and Agentic AI
Feature
AI Agents
Agentic AI
Definition
Autonomous software programs that perform specific tasks.
Systems of multiple Al agents collaborating to achieve complex goals.
Autonomy Level
High autonomy within specific tasks.
Higher autonomy with the ability to manage multi-step,complex tasks.
Task Complexity
Typically handle single, specific tasks.
Handle complex,multi-step tasks requiring coordination.
Collaboration
Operate independently.
Involve multi-agent collaboration and information sharing.
Learning and Adaptation
Learn and adapt within their specific domain.
Learn and adapt across a wider range of tasks and environments.
Applications
Customer service chatbots, virtual assistants,automated workflows.
Supply chain
management.business
process optimization,virtual project managers.
02.AI Agents 的发展基础与特点
Autonomy
Minimal human intervention
Task-Specificity
Narrow, well-defined tasks
Reactivity
Responding to changes
AI Agents 发展基础
核心是大语言模型和大图像模型,通过 API 调用接入,使其具备自然语言理解和视觉感知能力。
AI Agents特点
由感知、推理、行动和学习四个主要子系统构成,能实现感知、推理与行动三位一体的运作,如农业无人机可识别病果或坏枝并触发报警或处理机制。
03.Agentic AI 的关键架构改进
专责智能体协作体系
由多个专责智能体组成,通过消息队列等方式通信,如 MetaGPT 模拟公司部门角色构建智能体。
高级推理与规划能力
内嵌递归推理机制,如 ReAct、思维链和思维树等框架,提升应对不确定性或任务失败的能力。
持久化记忆架构
具备持久记忆子系统,包括情景记忆、语义记忆以及向量记忆等不同类型,如 AutoGen 智能体使用草稿本记录中间计算结果。
编排层 / 元智能体
引入编排器或元智能体,协调各子智能体的生命周期等,如 ChatDev 系统中的虚拟 CEO 元智能体。
04.AI Agents 与Agentic AI面临的挑战
AI Agents
存在幻觉、推理深度有限、无因果建模、上下文窗口受限等问题,缺乏自主目标设定能力、反思能力等,导致长期规划和故障恢复表现不佳。
Model / Reference
Application Area
Operation as Al Agent
Chat GPT Deep Re-search Mode OpenAI(2025)Deep Research Open Al
Research Analy-sis / Reporting
Synthesizes hundreds of sources into reports; functions as a self-directed research analyst.
Operator OpenAI (2025)Opera-tor OpenAl
Web Automation
Navigates websites, fills forms and completes online tasks au-tonomously.
Agentspace: Deep Re-search Agent Google (2025)Google Agentspace
Enterprise Reporting
Generates business intelligence reports using Gemini models.
NotebookLM Plus Agent Google (2025) NotebookLM
Knowledge Man-agement
Summarizes,organizes,and retrieves data across Google Workspace apps.
Nova Act Amazon(2025)Ama-zon Nova
Workfow Automation
Automates browser-based tasks such as scheduling. HR requests, and email.
Manus Agent Monica(2025) Manus Agenthttps://manus.im/
Personal Task Automation
Executes trip planning,site building, and product compar-isons via browsing.
Harvey Harvey AI (2025)Har-vey
Legal Automation
Automates document drafting legal review,and predictive case analysis.
Otter Meeting Agent Otter.ai (2025)0tter
Meeting Management
Transcribes meetings and pro-vides highlights,summaries.and action items.
Otter Sales Agent Otter.ai(2025)Otter sales agent
Sales Enablement
Analyzes sales calls.extracts insights, and suggests follow-ups.
ClickUp Brain ClickUp(2025) ClickUp Brain
Project Manage-ment
Automates task tracking,up-dates, and project workflows.
Microsoft Copilot Microsoft(2024)Mi-crosoft Copilot
Office Productiv-ity
Automates writing,formula generation.and summarization in Microsoft 365.
Project Astra Google DeepMind(2025)Project Astra
Multimodal AS-sistance
Processes text,image, audio,and video for task support and recommendations.
Claude 3.5 Agent Anthropic (2025) Claude 3.5 Sonnet
Enterprise Assis-tance
Uses multimodal input for rea-soning, personalization. and enterprise task completion.
▲业内有代表性的AI Agents
▲Agentic AI目前的应用包括科研助手、多机器人协调系统、医疗辅助诊断系统、网络安全风险处理系统。
04.AI Agents 与Agentic AI面临的挑战
Lack of Causal Understanding
Correlation mistaken
for causation
Inherited Limitations from LLMs
Sensitivity, biases
and high cost
Incomplete Agentic Properties
Restricted autonomy
and proactivity
Limited Long-HorizonPlanning and Recovery
Shallow long-term
reasoning
▲AI Agents主要存在因果推理能力差、幻觉较多、推理深度较浅、知识更新滞后
Agentic AI
在智能体协作环节面临错误传播、系统稳定性差等问题,且基础研究尚处早期,缺乏统一的标准架构、通信协议与可验证机制,可扩展性受限。
05.解决堵点问题的 10 大技术路径
检索增强生成
RAG
通过结合实时数据检索,RAG能够减少AI Agents的幻觉问题,并扩展其静态知识库。例如,在企业搜索和客户支持中,RAG可以确保生成的响应基于外部事实。
在多Agent系统中,RAG作为共享的“事实基础”,能确保Agent之间的一致性,并减少因上下文不一致导致的错误传播。
工具增强的推理
Tool-Augmented Reasoning
AI Agents如果能通过调用外部API、运行本地脚本或访问结构化数据库,就可以转变为交互式的问题解决者。
在多Agent系统中,工具增强的推理让每个Agent可以根据其角色调用特定的API,支持更清晰的行为边界,并减少任务交接中的模糊性。
Agent行为循环
Agentic Loop
Agent行为循环指的是推理、行动、观察这三者间的迭代。通过引入迭代循环,Agent可实现更谨慎、更适应上下文的行为。例如,Agent在生成摘要之前会验证检索到的数据。
在多Agent系统中,这种循环对于协作一致性至关重要。每个Agent的观察结果需要与其他Agent的输出进行协调。要实现这一点,共享内存和一致的日志记录是关键。
记忆架构
Memory Architectures
记忆架构的升级可以帮助AI Agents解决长期规划和会话连续性的问题。例如,Agents可以回忆之前的动作和反馈,从而实现个性化和适应性决策。
Agentic AI需要更复杂的记忆模型来管理分布式状态。此类模型允许每个Agent可以维护本地内存,同时访问共享的全局内存,以支持长期的系统级规划。
目前,研究者正探索情景记忆(Episodic Memory)、语义记忆(Semantic Memory)和向量记忆(Vector Memory)等不同架构。
角色专业化的多Agent编排
Multi-Agent Orchestration with Role Specialization
即使在单Agent系统中,开发者也可以通过将任务分解为子组件(例如,规划者、总结者)并进行模拟分隔推理,来实现轻量级的编排。
在Agentic AI系统中,编排是一项核心技术。元Agent或编排者在专业化的Agent之间分配任务,每个Agent都有不同的能力。
自反思与自我批判机制
Reflexive and Self-Critique Mechanisms
引入自我评估能力后,Agent在完成任务时可以使用二次推理过程来审查自己的输出,从而提高鲁棒性和减少错误率。
这项能力也可以扩展到Agent之间的相互评估。例如,一个验证Agent可以审计总结Agent的工作,确保协作质量控制。
程序化提示工程管线
Programmatic Prompt Engineering Pipelines
自动化任务模板、上下文填充和检索增强变量等技术可以减少手动调整提示词的不稳定性。这些动态提示词可以根据任务类型、AI Agents角色或用户查询进行结构化。
在Agentic AI系统中,每个Agent类型(例如,规划者、检索者、总结者)可以根据其功能生成或使用结构化的提示词。
因果建模与基于模拟的规划
Causal Modeling and Simulation-Based Planning
通过嵌入因果推断,AI Agents将能够区分相关性和因果关系,从而更稳健地进行干预模拟和规划。而在Agentic AI系统中,因果推理对于安全协调和错误恢复至关重要。
监控、审计与可解释性管线
Monitoring, Auditing, and Explainability Pipelines
通过记录提示词、工具调用、内存更新和输出,日志系统可以对AI Agents进行事后分析和性能调整。这些记录有助于开发人员跟踪故障、优化行为,并确保符合使用指南。
在Agentic AI系统中,日志和可解释性同样至关重要。审计跟踪对于识别哪个Agent导致错误以及在什么条件下发生错误是十分关键的。
治理感知架构
Governance-Aware Architectures
开发者可以为AI Agents引入基于角色的访问控制、沙箱和身份解析,以确保Agent在其范围内行动,并且其决策可以被审计或撤销。
在Agentic AI系统中,这一治理感知架构必须扩展到角色、Agent和工作流中,角色隔离可以防止AI Agents超出权限,而责任机制可以为决策分配责任并跟踪因果关系。
06.未来发展趋势
AI Agents
朝着更加自主化、智能化方向演进,具备主动智能,深度集成外部工具和因果推理能力,持续学习和信任安全机制不断完善。
Agentic AI
推动多智能体扩展和统一编排,具备长期任务管理能力和符合人类价值观的伦理治理。
总结
本文综述了 AI Agents 与 Agentic AI 的区别、发展特点、面临的挑战及解决路径,为智能体技术的发展提供了深入的分析和见解,未来智能体技术将朝着更自主、智能、高效协作的方向发展。
智能体研究综述
Thank you
AI Agents and Agentic Developments and prospects of AI