AI Agent打了个响指，商业齿轮加速转动

2025-03-18 16:14

3月16日，百度旗下文心大模型4.5和文心大模型X1正式发布。目前，两款模型已在文心一言官网上线，免费向用户开放。同时，文心大模型4.5已上线百度智能云千帆大模型平台，企业用户和开发者登录即可调用API；文心大模型X1也即将在千帆上线。无独有偶，OpenAI宣布GPT-4.5/5将很快陆续发布，且免费版ChatGPT将在标准智能设置下无限制使用GPT-5进行对话。不仅如此，字节跳动、阿里云等企业也纷纷下调旗下大模型产品价格。

降价和免费时代的来临无疑将加速AI技术的普及和应用落地，越来越多的企业和开发者开始尝试将AI技术应用到各个领域，从而催生出大量创新应用和商业模式，AI Agent（智能体）就是其中之一。近日，AI智能体企业ManusAI表示，7天来，Manus使用申请等候名单增加到两百万人。3月12日，OpenAI正式发布了一系列全新的Agent（智能体）开发组件，旨在通过自动化工具和标准化接口降低开发门槛，显著缩短智能体应用的开发周期。

这一系列围绕智能体的技术发布，从侧面说明AI智能体目前已经达到了爆发的临界点。伴随各大科技公司在智能体领域不断加码，2025年有望成为真正的AI智能体商业爆发元年。想象一下，未来只需简单一个指令，智能体便能领悟并执行复杂的任务；它们还能通过视觉捕捉用户的表情和动作，判断其情绪状态。这不再是好莱坞科幻电影中的场景，而是正逐步走进现实的AI智能体时代。

早在2023年11月，微软创始人比尔·盖茨就发文表示，智能体不仅会改变每个人与计算机交互的方式，还将颠覆软件行业，带来自我们从键入命令到点击图标以来最大的计算革命。OpenAI首席执行官山姆·奥特曼也曾在多个场合表示：构建庞大AI模型的时代已经结束，AI智能体才是未来的真正挑战。类比智能电动汽车，犹如其在新能源技术应用和里程焦虑之间寻找到某种平衡的增程路线一样，AI智能体让人工智能进入了“增程模式”，在AI技术和行业应用之间尽可能达成新的平衡。

被看好的AI智能体

作为人工智能领域的一个重要概念，学术界和产业界对AI智能体提出了各种定义。大致来说，一个AI智能体应具备类似人类的思考和规划能力，并具备一定的技能以便与环境和人类进行交互，完成特定的任务。或许把AI智能体类比成计算机环境中的数字人，我们会更好理解——数字人的大脑就是大语言模型或是人工智能算法，能够处理信息、在实时交互中做出决策；感知模块就相当于眼睛、耳朵等感官，用来获得文本、声音、图像等不同环境状态的信息；记忆和检索模块则像神经元，用来存储经验、辅助决策；行动执行模块则是四肢，用来执行大脑做出的决策。长久以来，人类一直在追求更加“类人”甚至“超人”的人工智能，而智能体被认为是实现这一追求的有效手段。

近些年，随着大数据和计算能力的提升，各种深度学习大模型得到了迅猛发展。这为开发新一代AI智能体提供了巨大支撑，并在实践中取得了较为显著的进展。比如，谷歌DeepMind人工智能系统展示了用于机器人的AI智能体“RoboCat”；亚马逊云科技推出了Amazon Bedrock智能体，可以自动分解企业AI应用开发任务等等。Bedrock中的智能体能够理解目标、制定计划并采取行动。新的记忆保留功能允许智能体随时间记住并从互动中学习，实现更复杂、更长期运行和更具适应性的任务。

这些AI智能体的核心是人工智能算法，包括机器学习、深度学习、强化学习、人工神经网络等技术。通过这些算法，AI智能体可以从大量数据中学习并改进自身的性能，不断优化自己的决策和行为，还可以根据环境变化做出灵活地调整，适应不同场景和任务。目前，AI智能体已在不少场景中得到应用，如客服、编程、内容创作、知识获取、财务、手机助手、工业制造等。AI智能体的出现，标志着人工智能从简单的规则匹配和计算模拟向更高级别的自主智能迈进，促进了生产效率的提升和生产方式的变革，开辟了人们认识和改造世界的新境界。

随着以通信、感知、计算为一体的“通感算”网络的构建，未来包括智能汽车、机器人、无人机、低空飞行器等在内的更广泛AI智能体将以前所未有的规模实现接入，通过将各类智能体互联互通，不断扩张单一智能体的能力边界，并借助多智能体的智慧涌现，实现智能体的大规模、高效协作与交互，从而完成从单体智能向群体智能的跃迁。

AI应用技术趋势的

底层逻辑

随着大模型技术的落地带来的成本降低，使得自动化的智能技术正在成为核心方向，大模型的产品形态形成了从Chatbot到Copilot再到智能体的趋势和方向。在此背景下，AI应用技术的三大底层逻辑正在浮现。第一重底层逻辑是从智能体到AGI。对比在移动互联网时代奠定的App生态，当前需要在AI时代奠定一个AGI应用生态。

从智能体发展看，人类在逐步强化程序的自动化、智能化程度，在智能体的尝试中，应用厂商结合深度学习等算法、知识图谱、RPA等技术实现了部分的自动化，其核心是在存量知识的基础上，实现由程序自主解决部分问题。随着基础模型能力的进一步提升，智能体在任务规划中的灵活性，在知识吸收运用的效率方面的上限或将进一步提升。在当前的基础模型能力下，若将智能体与工作流进一步结合，在工作流程中嵌入AI实现部分问题的智能+自动化解决，智能体实用性或将进一步改善，商业化或将进一步加速。

第二重底层逻辑是大语言模型推动智能体进入新阶段。AI智能体经历了从符号智能体、反应智能体，到基于强化学习的智能体、具有迁移学习和元学习的智能体，到基于大语言模型的智能体的阶段，智能体通过与外部环境之间的互动来提升自己的智能。第三重底层逻辑是多路径共同提升智能体整体智能化水平。“大模型+智能体”是通向AGI的路径之一。智能体用来描述表现出智能行为并具有自主性、反应性、主动性和社交能力的人工实体，能够使用传感器感知周围环境、做出决策，然后使用执行器采取行动，具备以上特征的智能体是实现AGI的关键一步。

AI智能体爆发元年已至？

2025年是否真的会如业界预测的那样成为“AI智能体爆发元年”？业内专家将人工智能发展类比自动驾驶技术的分级，划分为L1-L5五个阶段：聊天机器人、推理、智能体、创新者、组织者。第一阶段聊天机器人已经实现了。第二个阶段就是现在的大模型推理能力，第三就是智能体。可以把智能体分成两大类，一类是生成内容的智能体。一类是进行操作的智能体。操作智能体，又可以分为在数字世界进行操作的智能体和在物理世界进行操作的智能体。

第四是随着智能体不断发展，需要更多的创新。第五组织者主要是指大模型、智能体、创新者多了之后，需要用AI对社会的管理模式进行重新设计与协调。按照上述5个阶段划分，目前基本上处于智能体与创新者这两个阶段的转换过程中。未来每个人可能在生活和工作中有多个智能体。比如随时监测个人健康的智能体，会定期将健康数据汇总并给出健康建议。点餐智能体不需要你向它发出点餐指令，就可以根据你的饮食规律以及分享健康监测智能体中的数据，自行安排何时需要点餐，当你想要吃饭时外卖已经在门口了。每个人还可以有多个数字人智能体，比如帮你处理日常事务的数字人。

2025年，AI最重要的几个发展方向现在已经比较清晰。一是继续推进通用人工智能（AGI），在预训练受限之后，后训练的潜力逐渐体现出来。二是智能体大发展，行业智能体将会风起云涌。三是VLA大模型和具身智能将会有大发展。四是多模态融合趋势将会更加明显。

潜在风险不容忽视

AI智能体通过模拟和扩展人类的认知能力，有望广泛应用于医疗、交通、金融及国防等多个领域。有学者推测，到2030年，人工智能将助推全球生产总值增长12%左右。不过，在看到AI智能体飞速发展的同时，也要看到其面临的技术风险、伦理和隐私等问题。

一群证券交易机器人通过高频买卖合约便在纳斯达克等证券交易所短暂地抹去了1万亿美元的价值，世界卫生组织使用的聊天机器人提供了过时的药品审核信息，美国一位资深律师没能判断出自己向法庭提供的历史案例文书竟然均由ChatGPT凭空捏造……这些真实发生的案例表明，AI智能体带来的隐患不容小觑。因为AI智能体可以自主决策，又能通过与环境交互施加对物理世界的影响，其一旦失控将给人类社会带来极大威胁。哈佛大学教授齐特雷恩认为，这种不仅能与人交谈，还能在现实世界中行动的AI智能体，是“数字与模拟、比特与原子之间跨越血脑屏障的一步”，应当引起警觉。首先，AI智能体在提供服务的过程中会收集大量数据，用户需要确保数据安全，防止隐私泄露。

其次，AI智能体的自主性越强，越有可能在复杂或未预见的情境中做出不可预测或不当的决策。AI智能体的运行逻辑可能使其在实现特定目标过程中出现有害偏差，其带来的安全隐患不容忽视。用更加通俗的话来说，就是在一些情况下，AI智能体可能只捕捉到目标的字面意思，没有理解目标的实质意思，从而做出了一些错误的行为。再次，AI大语言模型本身具备的“黑箱”和“幻觉”问题也会增加出现操作异常的频率。还有一些“狡猾”的AI智能体能够成功规避现有的安全措施，相关专家指出，如果一个AI智能体足够先进，它就能够识别出自己正在接受测试。

目前已经发现一些AI智能体能够识别安全测试并暂停不当行为，这将导致识别对人类危险算法的测试系统失效。此外，由于目前并无有效的AI智能体退出机制，一些AI智能体被创造后可能无法被关闭。这些无法被停用的AI智能体，最终可能会在一个与最初启动它们时完全不同的环境中运行，彻底背离其最初用途。AI智能体也可能会以不可预见的方式相互作用，造成意外事故。

为此，人类目前需尽快从AI智能体开发生产、应用部署后的持续监管等方面全链条着手，及时制定相关法律法规，规范AI智能体行为，从而更好地预防AI智能体带来的风险、防止失控现象的发生。展望未来，AI智能体有望成为下一代人工智能的关键载体，它将不仅改变我们与机器交互的方式，更有可能重塑整个社会的运作模式，正成为推动人工智能转化过程中的一道新齿轮。

AI Agent：大模型的下一个高地

生成式AI云上创新，“全栈联动”将成关键词？

大模型进化论：AI产业落地将卷向何方？

从大模型到云端，“AI+云计算”还能讲出什么新故事？

【科技云报到原创】

转载请注明“科技云报到”并附本文链接

原文标题 : AI Agent打了个响指，商业齿轮加速转动