卷完参数卷应用，大模型落地有眉目了？

2024-04-07 17:19

国内大模型战场的比拼正在进入新的阶段。

随着产业界对模型落地的态度逐渐回归理性，企业客户的认知从原来的“觉得大模型什么都能做”的阶段，已经收敛到“大模型能够给自身业务带来什么价值上了”。

2023 年下半年，不少企业将目光锁定在行业模型上。如何降低大模型使用门槛，让大模型真正在行业里用起来，是业内普遍关注的焦点。

由此，国内厂商在大模型上的认知也在逐步统一——百度创始人李彦宏认为“卷大模型没有意义，卷应用机会更大”；腾讯高管汤道生表示“大模型只是开端，行业应用才是未来”；华为云CEO张平安明确大模型“为行业而生，聚焦B端行业客户”，更直言盘古大模型“没时间作诗、没时间聊天”。

这也意味着，更多大模型厂商将开始卷应用，这会是今年竞争最为激烈的板块之一。

大模型行业落地渴望 “开箱即用”

过去半年，大模型To B的落地应用摸索已经度过尝鲜期。

对于企业而言，他们希望更快使用上大模型，在市场竞争中获得优势。但大模型的技术门槛很高，因此企业并不会从头开始训练自己的基础大模型，更多是基于某个成熟的大模型做二次开发。

然而，想借用好现有的通用大模型，企业仍面临着三大难题：

首先，各类企业的场景需求、复杂程度、智能化程度千差万别，大模型能力边界与企业的场景需求如何快速、准确匹配；

其次，从模型到应用中间还需要诸多技术桥梁，诸如SFT、RAG、LangChain、Agent等技术，如何与大模型有机组合达成最优解；

第三，企业过去积累了大量IT设施、软件、企业数据、业务流程，如何让大模型与现有设施结合的情况下，保障企业数据信息安全。

换句话说，企业无论是基于开源或闭源的通用大模型来做行业化落地，都远没有到达开箱即用的程度。

不过这也成为大模型厂商在竞争中突围的方向，除了要在底层技术上继续夯实外，补足行业Know-how和成功经验也是重中之重。

在百度和阿里的发展经验中，似乎可以给大模型行业一些启示。

其中，百度用搭建行业模型、垂直场景模型和应用的方式赋能具体行业。

2023年3月，百度智能云推出千帆大模型平台，从算力、模型、到应用层层结合，为企业提供一整套大模型开发工具。

一年后，基于一线经验积累和实战反馈，百度智能云抽取出“研、产、供、销、服”环节中的典型场景，于近日推出了5款全新模型和7款应用产品，来解决企业用好大模型的“三大难题”。

以此次发布的国内首款大模型全面重构的智能客服——百度智能云客悦为例，相比传统客服，客悦可结合大模型的理解、推理、记忆能力，实现更友好的对话、更高效的运营。

比如，当用户提问“我的车总有吱吱吱的声音”，传统客服无法理解“吱吱吱”这种口语化的表达。

而客悦在大模型的加持下，会继续追问用户该问题持续的时间和频次，并通过推理反馈用户，可能是皮带老化或者张紧轮松动导致，建议到店检查。

若用户反馈没时间检查，客悦还会基于自身知识库，提醒不检修可能导致车辆失去动力、长期会引起发动机故障等问题，引起用户重视，守护行车安全。目前，用户问题自助解决率已超过90%。

在运营效率方面，上一代的传统智能客服进行业务办理、知识咨询、闲聊等能力，需要花费的人效约100人/天，而客悦仅需约15.5人/天，大模型客服运营效率提升6倍。

目前为止，百度智能云已经布局了电力、汽车、金融、政务等十余个行业大模型，并取得了不错的效果，客户中也出现了国家电网、浦发银行、泰康、吉利等知名企业。

相比之下，阿里采用了另一套逻辑：赋能于内部已有应用和服务，再技术外溢至行业客户。

除已经发布“通义千问”大模型外，夸克也发布了自研大模型，应用于通用搜索、医疗健康等场景；后加之内部推行“云钉一体”，作为办公一体化平台，钉钉上线AI魔法棒，推出17项与AI相关服务，也为通义千问大模型助力颇多。

同时，阿里也提供了不少类似于Anyone fit类型的图像模型解决方案，其工具十分贴合电商需求场景。

因在电商、物流层面的深厚积累，让阿里拥有了对不同领域的行业特点、业务流程和客户需求有了充分的认识。

基于此，阿里的产品便可以在深度了解用户需求的基础上，为客户提供定制化的解决方案，满足其业务需求，提高其业务效率和竞争力。这让大模型有了其应有之意，不至于沦落为“无源之水”。

头部大厂领跑大模型行业落地

在大模型的 toB 竞争中，本质而言，是取决于客户企业对商业价值的认知。和其他行业一样，在大模型领域，“多快好省” 和 “物美价廉” 难以两全，匆忙上阵的结果可能是一地鸡毛。

因此，企业客户在大模型的选择上更为审慎。尽管大模型的应用还在初期，但企业在模型选择、模型可靠性、应用成本、使用门槛等层面，已有各种考量和顾虑。

百度集团副总裁侯震宇曾在采访中表示：“最终能够让大模型服务推广开的只有两个原因：第一个是模型效果，第二个是成本。”

以百度智能云为例，其大模型的调用和训练成本一直在下降。文心一言开启内测后，一个月就迭代了四次。

根据百度披露的数据，文心一言的推理成本如今只有发布之初的十分之一，在发布的3个月内推理效率提升10倍，模型推理性能提升50%，模型算力利用率提升1倍。

侯震宇透露，随着技术迭代带来的成本下降，不管是在模型使用，还是在模型微调甚至在模型再训练方面，“价格应该不会成为大家使用或者拥抱大模型的瓶颈”。

与此同时，在SuperCLUE中文大模型7月最新榜单中，百度的大语言模型产品文心一言以62分的总成绩一举超越越GPT-3.5-turbo（59.79）和ChatGLM-130B（59.35）等，稳居行业头部。

除了成本和效果，大模型从开发、应用到调优的每一个环节如何落地，如何基于数据安全合规进行私有化部署等，都是企业客户重点关注的问题。

例如，很多企业需要的聊天机器人，并不是选择具备强大通用能力的大模型就可以，还要求大模型厂商能够提供易用性、完备度、安全性、稳定性都有保证的工具链。

在关注大模型技术栈完备性的同时，企业还需要选择适合自身业务的大模型厂商——既有充分的产业应用经验积累，也能够将技术应用到实际业务场景中。

目前，百度智能云推出的千帆大模型平台就拥有较为全面的数据服务能力，从生成、标注、回流再到模型训练（Post-pretraining、Fine-tuning、Prompt-tuning）、模型评估（主观评估、客观评估）和压缩、自动化 Prompt 工程、到插件应用编排，客户都可以在千帆上一站式完成。

这意味着企业客户可以将基于千帆平台从0开始训练自己的专属模型，同时训练好的模型也可以部署和托管在千帆平台上，获得极致的性能、企业级的高可用性和安全环境。

由于千帆平台已经制备了开箱即用的使用流程，用可视化产品界面的方式引导用户使用，极大降低了使用门槛。对于企业级市场比较担心的安全可靠问题，也内置了安全机制，确保模型的输入和输出的安全。

不久前，IDC发布的《AI大模型技术能力评估报告，2023》对国内主流大模型，包括百度、阿里、腾讯、华为、科大讯飞、360、商汤等14家厂商参进行了评估。

IDC分别对大模型的平台、创新、通用、算法、服务、生态合作、行业覆盖和安全可解释性等诸多方面进行了评价，其中百度 7 个满分，阿里 6 个满分。百度在算法模型、行业覆盖领域拿下行业唯一满分。

可以看到，头部大厂的大模型产品已经有所成效。相较之下，部分初创和腰部公司开始呈现疲态。

从光年之外退出竞争、讯飞大幅亏损难以支撑大模型投入便可以得知，一些 “笨鸟先飞” 的企业已逐渐落后于发展大势。

对于企业业务而言，现阶段更加稳妥的方式还是在大厂之间做出抉择。大厂大模型更能保证服务交付、运维和维保，这也是企业对自身向智能化方向转型更加负责任地选择。

结语

随着企业研发、生产、销售、人力等各项业务场景数字化深入，如何借助大模型的力量，发挥出应用的最大价值，正成为企业商业制胜的关键所在。

接下来的竞争，对于企业而言，不再是局限于大模型的追逐，而是如何基于大模型对应用产品进行自我优化和革新。

对于大模型厂商而言，比拼的不仅是算力、算法和数据，未来长期的发展比的更是落地应用、生态渠道、客户服务、运维等系统性、全面性的支持。

这需要厂商具备强大的技术水平，以及不断迭代升级的能力。要满足可控和合规的要求，也需要厂商有较强的综合能力，能够长期稳定的投入人力物力。

相关阅读

大模型会给操作系统带来什么样的想象？

打造生成式AI应用，什么才是关键？

第五次工业革命，中国AI企业如何打造新质生产力？

【科技云报道原创】

转载请注明“科技云报道”并附本文链接

原文标题 : 卷完参数卷应用，大模型落地有眉目了？

本地收藏打印推荐给朋友

声明： 本文由入驻维科号的作者撰写，观点仅代表作者本人，不代表OFweek立场。如有侵权或其他问题，请联系举报。

发表评论

共0条评论，0人参与

登录登录即可访问所有OFweek服务

用户名/邮箱/手机：
密码：
忘记密码？
用其他账号登录： QQ | 微信 | 新浪微博

请输入评论内容...

请输入评论/评论长度6~500个字

暂无评论

图片新闻