大模型在先,小模型在后,生成式AI试水工业,如何破局数据短缺/可靠性不足?

2024-12-11 14:13

物联网智库

关注

作者：彭昭（智次方创始人、云和资本联合创始合伙人）物联网智库原创

这是我的第352篇专栏文章。

在我之前的文章《从LLM大模型到SLM小模型再到TinyML,这个领域有望增长31倍》中，曾经提到小模型SLM的进展，如今这一领域正在悄然发生突破。

小模型SLM，可以看作是大模型LLM的“迷你版”，它们虽然体型小巧，但却拥有着不容小觑的能力。相比动辄数百万、数十亿参数的GPT-4等大模型，SLM的运行规模要简单得多。经过优化的SLM能够高效处理较为简单的任务，而无需消耗大量计算资源。

如今，小模型正朝着产业落地的方向大步迈进，它们不再是实验室里的“玩具”，而是正在成为各行各业的“生力军”。

科技巨头们已经嗅到了小模型的无限潜力，纷纷加入这场争夺未来的战局。

微软、谷歌和苹果等公司均已入局小模型SLM，例如微软的Phi-3、谷歌的Gemma和苹果的Foundation Models。

最近，微软更是推出了适用于工业领域的全新AI小模型。

通过与拜耳、罗克韦尔自动化、西门子等公司合作，这些小模型使用行业特定数据进行了预先训练，可用于处理一些关键问题。这就像是为每个行业量身定制了一套“智能装备”，让AI的力量深入到每个生产环节，提升效率、优化流程、创造价值。

今天这篇文章，我们将一起探索小模型在工业应用中的最新进展，了解它们所蕴藏的机遇与挑战。

小模型与AI代理：下一个热门？

首先，我们需要进一步理清大模型与小模型之间的区别，如上图所示。

小模型之所以“小”，不仅仅在于其参数数量较少，更重要的是，小模型常常在小型数据集上进行微调，以优化其在特定任务上的性能，使其更加契合业务工作流的需求。

小模型的强项在于处理特定任务和工作流程。尽管参数数量有限，但当使用定制数据集针对特定领域任务进行微调时，小模型完全能够胜过大型通用模型。针对特定任务的训练可以减轻幻觉现象，增强问题解决能力。

资源效率是小型语言模型的另一大亮点，对于希望跨越各种平台和设备实施AI解决方案的企业来说，它们尤其具有吸引力。小模型使企业能够以更简单的基础架构和更低的成本，充分享受AI带来的优势。据测算，小模型可以节省高达75%的模型训练成本和超过50%的总部署成本。

在小模型的基础上，我们还可以玩出许多新花样。

一些公司将小模型用于AI代理工作流中，其中多个小模型通过通信和协作来执行更加复杂的任务。

例如，在AI代理工作流中，第一个AI代理可能负责规划如何解决任务，第二个AI代理进行必要的研究，第三个AI代理执行该计划，第四个AI代理则验证和评估结果。这种协作方式展示了这些模型如何协同工作，以提高生产力并实现更复杂的结果。

说到这里，我来解释一下什么是AI智能代理。

AI代理的官方定义是一种能够感知环境、进行决策和执行动作的智能体。

简而言之，ChatGPT不属于AI代理，但战胜李世石的AlphaGo可以被视为AI代理。

目前，我们与AI的交互形式基本上都是先输入指令，AI模型根据指令内容做出响应，这就导致我们每次都需要提供有效的提示词，才能达到预期效果。

而AI代理则不同，它被设计为具有独立思考和行动能力的AI程序。我们只需要提供一个目标，比如写一个游戏、开发一个网页，AI代理就会自主生成一个任务序列，开始工作。

让我们通过几个例子来更深入地理解AI代理。

一个初级的AI代理，是家中的空调自动控制系统。它遵循简单的“如果-那么”原则运行：如果温度低于设定点，则打开空调暖风；如果温度高于设定点，则关闭空调暖风。这种基础的AI代理虽然简单，但在日常生活中已经发挥了重要作用。

而高级的AI代理，如DeepMind的AlphaGo，则是专为复杂的围棋而设计的人工智能系统。AlphaGo展示了非凡的学习能力，最终击败了世界冠军围棋选手。这一里程碑式的事件，彰显了AI代理在处理复杂任务方面的巨大潜力。

就像俄罗斯套娃一样，多个初级和高级的AI代理可以建立起分层代理系统。

分层代理是一种将复杂任务分解为更简单的子任务，并以分层结构组织起来的AI系统。这种方法允许代理管理不同级别的抽象，更有效地处理复杂问题。

分层代理的一个典型例子，就是亚马逊Amazon Go商店的“Just Walk Out”技术。该系统在运作中表现出了清晰的层级结构：

顶层：整体商店管理和库存跟踪

中级：客户跟踪和行为分析

低级：产品识别和交互检测

最低级别：传感器数据处理和融合

依靠这些AI代理的协同工作，Amazon Go以“不用排队，拿了就走”的全新购物体验，在零售行业和科技圈吸引了无数目光。

上述案例只是冰山一角，AI代理在实际应用中的想象力正在被激发。

小模型与Copilot覆盖超100家公司12万用户

在了解了小模型与AI代理的概况后，让我们一起探索微软与工业企业的最新合作。

本次尝试微软小模型的企业包括拜耳、罗克韦尔自动化、西门子、Sight Machine等。

以罗克韦尔自动化为例，该公司从操作层面开始尝试应用小模型。在人机界面可视化平台FactoryTalk Optix的食品和饮料版本中，他们运用小模型，将行业特定功能的优势带给制造业一线工人，支持食品和饮料领域的资产故障排除。AI模型为工厂车间工人和工程师提供关于特定制造流程、机器和输入的实时建议、解释和知识。

另一款产品FactoryTalk Design Studio是罗克韦尔自动化专注于系统设计的云原生软件，它使用Copilot增强了PLC代码创建和用户管理。工程师能够使用自然语言提示执行产品指导、代码生成、故障排除和代码解释等任务，使系统设计更快、更直观。

同样，西门子正在为CAD解决方案NX X软件引入全新的Copilot。该软件利用经过调整的AI模型，使用户能够通过自然语言提问、获取详细的技术见解并简化复杂的设计任务，实现更快、更智能的产品开发。

目前，包括舍弗勒和蒂森克虏伯自动化工程在内的100多家公司正在使用西门子工业Copilot来简化流程、解决劳动力短缺问题并推动创新。12万名西门子工程软件用户，现在有机会通过生成式AI驱动的助手来提升工作效率。

作为敢于吃螃蟹的用户，蒂森克虏伯自动化工程公司是首家使用Copilot的公司，并且计划从2025年初开始，在该公司的全球体系内普及应用。

根据实践，工程师现在可以在30秒内创建可视化面板，并生成代码，根据经验这些代码仅需20%左右的调整就可以直接应用。这简化了工作流程，减少了人工工作量，解决了熟练劳动力短缺的问题。

就具体场景而言，蒂森克虏伯使用AI辅助开发用于生产汽车电池的自动化系统。例如在一台电池质量的检测装置中，传感器、摄像头和测量系统集成在一起，监控多个阶段的电池单元质量，进行复杂的评估以检测超出设定阈值的放电。Copilot通过自动执行多个任务，如数据管理、传感器配置、电池质量检测等各个重复性步骤，辅助操作员增强了该设备的运行效果。

Copilot：工业生成式AI的现实角色

在工业领域，“想到”和“做到”完全是两码事，生成式AI的工业价值尚需被验证。

古人云“欲得其利、先知其弊”，要充分发挥小模型的优势，就必须了解它的局限性。

生成式AI的弊端在于可靠性较低，具有不可解释性，只能应用于对可靠性要求不高的场合。

小模型的缺点则是精度有限，无法捕捉大规模和复杂数据集中的细致特征和关系，预测能力相对较弱；此外，它们难以应对复杂问题。这些弊端决定了小模型只能承担辅助思考的角色，为我们提供更多可行性方案作为选择，而最终决策仍需由人来做。

在实际应用过程中，也是挑战重重。

工业领域广泛使用AI的最大障碍是数据的缺失。由于工业涉及设备、工艺、操作、环境等多重因素影响，获取大量且多维的全面数据难度很大。大多数制造商虽然坐拥数据，但其中大部分是时间序列数据，没有得到适当的标准化，甚至无法用于AI的模型训练。

数据问题的本质，很多时候不单纯是技术问题，而是人员和流程问题。不成熟的数据管理流程、始终存在的OT与IT鸿沟，以及缺乏对小模型的理解，都是导致生成式AI目前仅限于一次性试点或实验的因素。

因此，目前生成式AI在工业领域更多以虚拟助手的功能存在，并将会持续较长时间。

这些AI虚拟助手为工厂车间操作员提供指导，或帮助控制工程师编写PLC代码。鉴于当前吸引和留住工厂车间人才的挑战，Copilot能够轻松帮助合成实时信息或提供编码辅助。

过去，工程师需要熟悉云平台、传感器、物联网、人工智能和不同类型的时间序列和工程数据，而生成式AI则允许工程师轻松进行数据查询、可视化和工作流程，而无需担心复杂性。操作员可以按需提出问题，而不需要了解软件。

许多制造企业配备了复杂的系统和更多的自动化设备，但那些拥有几十年经验与知识的资深员工却逐渐离开了职场，制造商们很难找到年轻的技术人员来维护现有的系统。Copilot可以成为帮助缩小这一差距的工具。

例如，工业软件企业Aveva的AI助手可以帮助操作员回答以下问题：上个月车间的最大产量是多少？或者为什么这台压缩机本周效率较低？杜邦公司也已经开始使用生成式AI来帮助工程师更快地找到信息，生成式AI可以节省数小时的手册搜索时间。

这些Copilot就像操作员的专家顾问，根据需要建议如何提高产量、降低能耗等。从某种意义上说，它们与原有的“专家系统”并没有本质区别，是否采纳这些建议取决于操作员。

面临的挑战也与过去的“专家系统”大同小异：如何建立对顾问的信任。工厂中的新配方经常出现，如果没有适当的更新和维护，专家系统也会很快过时。另一个风险在于，如何检查和验证所有生成式AI的输出。AI不会说“我不知道”；如果没有数据，它可能会进行编造。

写在最后

在这个万物互联、智能无处不在的时代，小模型和生成式AI正在工业领域掀起一场革命。从制造车间到产品设计，从运营优化到故障诊断，AI正在重塑着每一个环节。

然而，我们也必须清醒地认识到，工业领域的AI应用之路并非坦途。数据缺失、可靠性不足、解释性有限等挑战，都在提醒我们要谨慎对待这项新兴技术。尽管如此，我们仍然有理由对未来保持乐观。

随着技术的不断进步和企业实践的深入，人机协作将更加紧密，小模型和生成式AI也将在工业领域释放出更大的潜力。

参考资料：

《忍不住谈谈工业大模型》，作者：郭朝晖，来源：蝈蝈创新随笔

《Microsoft Introduces New Adapted AI Small Language Models for Industry》，作者：Colin Masson，来源：ARC Advisory Group

《What is Agentic AI? Is It the Next Big Thing?》，作者：Nora He，来源：arcee.ai

原文标题 : 大模型在先,小模型在后,生成式AI试水工业,如何破局数据短缺/可靠性不足?

本地收藏打印推荐给朋友

声明： 本文由入驻维科号的作者撰写，观点仅代表作者本人，不代表OFweek立场。如有侵权或其他问题，请联系举报。

发表评论

共0条评论，0人参与

登录登录即可访问所有OFweek服务

用户名/邮箱/手机：
密码：
忘记密码？
用其他账号登录： QQ | 微信 | 新浪微博

请输入评论内容...

请输入评论/评论长度6~500个字

暂无评论

图片新闻