人工智能时代：AI Agent才是实现超级个体的新赛道？

在去年ChatGPT引领的大模型浪潮之后，AI Agent迅速崭露头角，成为业界的新焦点。比尔盖茨撰文预测它将颠覆软件行业和人机交互方式，引起了广泛关注。

据外媒MattSchlicht报道：“至少有100个项目正致力于将AI代理商业化，近10万名开发人员正在构建自主Agent。”微软、OpenAI和谷歌等国外科技巨头更是将其视为下一阶段发展的关键战场。那么，AI Agent究竟是什么？

AI Agent是什么？

AI Agent被翻译为人工智能体或AI代理。 OpenAI将 AI Agent 定义为以大语言模型（LLM）为大脑驱动，具有自主理解、感知、规划、记忆和使用工具的能力，能自动化执行复杂任务的系统。它可以模拟人类的智能行为，处理复杂的任务，并根据环境的变化进行自适应和学习，从而提高智能化水平和性能。

简单来说，就是有能力主动思考和行动的智能体。用一个通俗易懂的例子来讲，“大语言模型只能编个简易俄罗斯方块，而AI Agent可以整出一个和平精英。”

众所周知，移动互联网时代的产品形态是APP，那么AGI时代的应用形态则是AI Agent。

AI Agent的原理

AI agent的核心组件包括记忆、规划、工具。

记忆组件负责存储信息，包括长期记忆和短期记忆。目前的GPT等大模型只有基础的短期记忆能力，一旦进行多轮对话就容易忘记之前的内容。

而AI Agent则在拥有更强的上下文和跨对话记忆的基础上，不仅能记住先前的对话内容和用户偏好，还能记住对环境的感知形成世界观，从而提供更个性化和连贯的交流体验。

规划组件负责对未来行动的决策和计划制定，在执行复杂任务时将其分解为子目标，分步解决，并根据外界的反馈进行反思和优化。

工具组件负责调用外部工具来获取额外的信息或执行能力。GPT4的插件生态与此类似，但这需要用户根据需求自己选择相应的插件，而AI Agent可以自动调用工具使用。

那AI Agent 和GPTs相比到底有哪些区别呢？

GPTs VS AI Agent

OpenAI 发布的GPTs算是 AI Agent 初级形态产品。但目前GPTs是基于prompt（提示词）实现的，针对某个单项任务，只有当你输入明确有效的prompt时，才有可能得到想要的结果。

而 AI Agent 就如同《星际穿越》里的塔斯、《钢铁侠》里的贾维斯一样，可以根据你提出的需求，自主思考并决策，将目标任务拆解为多个子任务，然后利用外部工具一步步执行，直到达成目标。

AI Agent和大模型的区别在于拥有长期记忆，可以感知世界、协同处理任务，会解决问题并做出决策。

举一个例子，来自斯坦福大学以及谷歌的人工智能研究团队创造了斯坦福维尔虚拟村庄，里面的村民是25个不同的AI Agent，他们通过训练具备了一定的社交技能并拥有各自的性格和社会角色。

在小镇的生活中他们会记住每天发生的事，并基于新的记忆进入新的一天。而且随着互动的增加建立了复杂的关系，形成各类群体，并参与各种游戏和活动，甚至自主策划了一场情人节派对，表现出了令人惊讶的自主性和智能性。

再举一个生活中的例子，当你需要做年终汇报PPT时，AI Agengt自动将任务分为几步，并调用其他工具搜集资料、制作图表、生成内容，甚至协同其他Agengt工作，最终完成PPT。而你使用GPTs则需要自己使用各类插件，每一步都要输入相应的提示词，并且进行反复调试才可能得到想要的结果。

那么目前除了上面提到的斯坦福维尔虚拟村庄，还有其他已经开发出来的AI Agent吗？

AI Agent应用

事实上，国外已经存在很多AI Agent架构与产品，例如：AutoGPT、Generative Agent、GPT-Engineer、BabyAGI、MetaGPT、GPT Researcher，这些搭载了大型语言模型能力的Agent不仅可以生成内容，还可以直接解决各种场景中的各种问题，涉及零售、房地产、旅游、客户服务、人力资源、金融、制造业等多个领域。

AI Agent开源性项目的典型代表之一是AutoGPT，它相当于一个完整的工具包，可以为各种项目构建和运行自定义AI Agent。该工具使用OpenAI的GPT-4和GPT-3.5大语言模型(LLM)，允许为各种个人和商业项目构建Agent。

AI Agent闭源性项目包括：使用个人知识库的金融人工智能代理平台，“开发人员虚拟实习生”BitBuilder，人工智能驱动的软件开发商GitHub Copilot X等。

美国大语言模型明星创业公司Inflection AI也准备加入其中。据透露其正在开发一款私人助理，可以充当导师，以及处理在旅行过程中的行程预定、航班积分、酒店预定等任务。去年6月，Inflection AI的估值就达到40亿美元，累计融资额15.25亿美元，在基础大模型公司中仅次于OpenAI。

亚马逊云科技也宣布了Amazon Bedrock Agents新功能，它可以把开发、部署和管理多个Agent的能力打包集成在一起，开发者只需要几次点击，就可以构建Agent应用。

而在国内，钉钉总裁在采访时称钉钉计划在4月份推出AI Agent Store，目标是成为中国最活跃的AI Agent孵化、分发和交易平台，三年内产生1000万个AI助理。联想集团副总裁对媒体表示，联想个人Agent将在不久后与用户见面。

AI Agent发展前景

但是目前的AI Agent还未能达到理想效果，其发展仍然面临一些困境，一方面它的底层技术大模型还不够完善，复杂推理能力有待提高。

另一方面外部生态融合度不高，比如我们无法直接使用GPTs直接操作SAP或金蝶等ERP系统，目前AI Agent的第三方API基本以搜索和文件读取功能为主，很难做到比较完整的跨应用生态。

不过AI Agent是当前通往AGI的主要探索方向，它是释放大模型潜能的关键。

随着的研究发展，AI Agent与人的合作将逐渐加深，人机协作的模式逐渐从人类完成绝大部分工作的嵌入（Embedding）模式、人类和AI协作工作的副驾驶（Copilot）模式，逐渐过渡到AI完成绝大部分工作的智能体（Agent）模式。

AI Agent可以让大模型从“超级大脑”进化为人类的“全能助手”。比尔·盖茨预测在未来的5年内，AI Agent将得到广泛应用，每个用户都将拥有一个专属AI Agent 。在人机融合加深的趋势下，每个普通个体都有可能成为 超级个体 。

AI Agent常见的问题有哪些？

什么是AI Agent？
AI Agent，即人工智能代理，是一种利用人工智能技术模拟人类行为和决策的软件程序，能够自动执行任务、处理信息并提供服务。
AI Agent可以应用于哪些领域？
AI Agent可以应用于客户服务、个人助理、数据分析、医疗诊断、教育辅导、智能家居控制等多个领域。
AI Agent如何与人类交互？
AI Agent通常通过文本、语音或图形界面与人类交互，理解用户的需求并提供相应的反馈或服务。
AI Agent的智能程度如何？
AI Agent的智能程度取决于其背后的算法、数据和训练。一些高级的AI Agent能够进行复杂的对话和决策。
使用AI Agent是否需要专业知识？
大多数AI Agent设计为用户友好，不需要专业知识即可使用。但对于一些特定的企业级应用，可能需要专业人员进行配置和维护。

文章转自：网梯科技