Agentic AI时代来临,一大波AI Agent正在路上!
Agentic AI时代来临,一大波AI Agent正在路上!
作者:航标
来源:IT精选
“2025年将是智能体(AI Agent)之年”,这是知名财经作家吴晓波在其2024年终秀上做出的预言。吴晓波的这一预言非常有代表性。Gartner就预测,到2028年有1/3的企业应用将包含“AI Agent”,而今年这一比例还不到1%。德勤也预测,在使用生成式AI的公司中,有1/4将在2025年推出代理AI试点项目或概念验证,到2027年,这一比例将增长到GenAI用户的一半。 显然,这些预测并非空穴来风,而是基于大量公司正在投资AI Agent的事实。谷歌云不久前发布了一款新的AI Agent开发工具——AI Agentspace,开发者可以利用它访问和构建AI Agent,并鼓励更多合作伙伴将自己开发的AI Agent提交到AI Agentspace。同时,谷歌云还推出了多个由Gemini 2.0大模型支持的AI Agent。 Salesforce在不久前举行的Dreamforce大会上宣布要以AI Agent为先,希望能提供超过1万个智能体来满足客户需求,还推出了用于构建AI Agent的低代码工具Agent Builder来帮助构建AI Agent。Salesforce将它们称为数字劳动力,用以替代部分人工工作。 OpenAI CEO Sam Altman在最近发布的一篇名为《Reflections》的博客文章中也提到,OpenAI在2025年也将上线第一批AI Agent,加入到“劳动力大军”,以提升公司的产出效率。类似的工作微软、AWS等众多大公司也在进行。 实际上,我们只要想象一下下面这些场景,就没有理由不认可AI Agent的市场前景:只要告诉AI助手你旅行的目的地和出发时间,AI助手就能帮你安排好所有的旅游行程,包括订好票、订好酒店、安排好行程;或者作为一名供应链管理员,你的AI助手能自动根据市场情况(包括上游供应方和下游需求方的变动)向供应商下达订单并优化运输路线,以确保及时交货,而无需人工干预……这些谈了很多年、听起来似乎有点遥远的事情,AI Agent正在把它变成现实。 不少人甚至认为,AI Agent的流行可能比ChatGPT的成功带来的冲击更大。因为它标志着一个新的时代——Agentic AI(代理式人工智能)时代的到来,代表着人工智能在我们的工作和生活中所扮演角色的根本转变。 何为Agentic AI? 众所周知,ChatGPT的成功引发了AI聊天机器人这类生成式AI应用的爆发,但与Agentic AI相比,这类应用显得弱了很多。这些系统虽然也是由大型语言模型支撑,但这些模型通常仅每隔数月更新一次。它们根据训练数据生成响应,缺乏主动互动或适应外部环境的能力。尽管可以通过外部数据库和工具来增强其功能,但它们仍然受限于其预编程知识的基本框架。 比如,现在流行的聊天机器人大多遵循这样的设计模式:用户输入内容(提示词),大语言模型(LLM)根据这些内容(有时结合向量数据库等)做出回应,然后等待下一个输入请求。它们主要为文本输入、文本输出而设计,有些支持多模态,但也仅限于输入和输出的范畴。 而Agentic AI则是一种可进化的智能系统,其最大的特点是具备自主性、主动性和适应性,能够在没有人类干预的情况下做出决策并执行任务以实现特定目标。例如,它可以规划复杂任务并将其分解为子任务,通过持续的规划、推理和反思过程来提高准确性和效率。 Agentic AI还能根据任务需求灵活处理信息。它们能够调用外部工具,借助这些工具收集和利用最新信息,从而做出动态决策,甚至与其他代理和数据库进行协同工作。同时,它们还能在任务执行过程中不断学习和完善自身。 Agentic AI之所以能实现这样的功能,是因为AI Agent具备三种普通AI聊天机器人所不具备的关键能力: 第一,推理能力。AI Agent的核心是负责规划和推理的大语言模型(LLM),它能够将复杂问题分解,制定解决问题的计划,并为计划中的每一步提供合理理由。 第二,行动能力。AI Agent具有与外部程序交互的能力。这些交互可能包括网络搜索、数据库查询、代码执行等。LLM会决定何时以及如何使用这些工具来解决问题。 第三,记忆能力。AI Agent可以访问之前发生事件的“记忆”,其中包括AI Agent思维过程的内部日志以及与用户的对话历史。这使得交互更加个性化和情境感知。 一个Agentic AI系统的典型工作流程如下:用户向AI Agent输入或说出需求;LLM会制定一个计划来满足用户的需求;AI Agent尝试执行计划,这个过程中可能会使用外部工具,如摄像头等;LLM会查看执行结果,判断用户的目标是否已达成。如果未达成,它会重新开始并再次尝试,重复这一过程,直到LLM判断结果满意为止。一旦满足要求,LLM就会将结果呈现给用户或者自动执行(如驾驶车辆等)。 大部分工作终将被AI接管 自动化、智能化一直是人们追求的目标。比如,我们熟知的RPA(机器人流程自动化)就在自动化领域迈出了重要一步。 实际上,除了缺乏与客户进行智能化互动的能力外,RPA与Agentic AI在某些方面确实有几分相似。然而,这两者在本质上存在显著差异。RPA通常遵循固定的工作流程,严格按照预定的规则执行,主要依赖于传统的自动化技术,如屏幕抓取和硬编码规则。这些技术缺乏灵活性,使得RPA主要应用于固定流程、繁琐的工作上,适应环境变化的能力较弱。 而Agentic AI则是基于大型语言模型(LLM)实现的,能够理解用户需求并做出针对性的计划,从而应对更为复杂的场景。例如,Anthropic的“Computer User”可以像人一样完成鼠标点击、按钮选择、文字输入等功能。OpenAI也宣布将推出“Operator”这一全新的AI Agent产品,它能够自动执行各种复杂操作,包括编写代码、预订旅行、自动电商购物等,还能在用户的设备上操作,执行如网页浏览、电子邮件管理等任务。显然,Agentic AI的适应能力远远超过RPA。 凭借其强大的推理和执行能力,Agentic AI不仅能将那些由人完成的单调、重复任务转移给AI Agent,实现各种工作的自动化,还能处理一些更为复杂的应用需求。同时,Agentic AI将改变人机协作的许多方面,涉足以前与人工智能主导的自动化隔离的工作领域。 目前,Agentic AI已经在诸多领域得到应用,从自动驾驶车辆到医疗保健、工业自动化和个人助手等。以医疗保健领域为例,AI Agent可以用于个性化医疗、机器人手术和患者监控系统,还可以帮助监测生命体征,将信息传递给医疗保健提供商,并帮助更有效地管理患者护理。 毫无疑问,人类的很多工作未来将会被AI Agent取代。根据IDC的研究,未来三年内,全球2000强企业中至少有40%的企业将使用AI代理和代理工作流程来实现知识工作的自动化。 当然,AI Agent不仅会替换一些人的工作,也会催生出一些新的工作机会。例如,将出现与管理、培训和监控AI Agent相关的新工作、新角色和新专业;在网络安全领域也将增添新的专业方向,因为需要AI Agent来防御同样使用AI Agent的网络攻击者等。 一个完全属于AI Agent的数字世界或将出现 在很多科幻电影中,机器人与人类发生冲突的场景并非完全凭空想象。至少因为未来AI Agent很有可能催生出一个完全属于其自身的数字世界。 AI Agent如果需要其他信息是可以调用其他工具或AI Agent的。目前,AI Agent访问的还是为人们设计的常规网站和应用程序。而未来,很可能会出现专门为Agent设计、供其使用的软件工具。 自从计算技术诞生以来,软件的用户一直是人类。现在有了AI Agent,软件首次成为了软件的用户。由于这些软件是专门为AI Agent设计的,因此它们更为实用、模块化且更适应AI Agent的特性。 这些专门服务于Agent的软件将组成一个相对独立的数字世界。这是一个全新的数字世界,人类如何掌控它还需要进一步研究。同时,它的出现也有可能会打破既有的软件、硬件领域平衡,并在塑造新格局的过程中,可能会迎来既得利益者的衰落与后来者的崛起。 另外,值得一提的是任何事物都有两面性,Agentic AI的出现有可能会降低一些人的能力。比如,有人可能会像依赖拐杖一样依赖自主式人工智能,而不学习新的技能或知识,将自我提升的任务外包给AI Agent。对于这些问题如何处理,目前还未可知。 当然,现在谈这个问题还为时尚早。以我们人类的智慧,这些问题总是会找到解决之道的! |