金融大模型，要听见远方的风

2024-05-11 09:16

金融大模型，被认为AI大模型产业化落地的第一站。

金融行业有着结构化数据充沛、应用场景丰富、数字化基础设施良好等一系列特点，这些都是融合AI技术的利好因素。所以当AI大模型开始爆火之后，各界会不约而同认为金融是AI大模型的天然良港。

从2023年至今，中国金融大模型市场的发展也确实印证了这一判断。根据相关数据，目前中国市场已经有近20个金融大模型落地应用，头部金融机构要么已经应用AI大模型，要么展示了对AI大模型的研发与应用计划。

要知道，在降本增效的大背景下，金融机构目前还需要兼顾移动金融、数字系统自主替代等多项数字化投资目标，能够分给AI大模型的资源并不丰富，而AI带给金融机构的投资回报比还非常有限。高效上马大模型，对金融行业来说真的值得吗？

记得2023年我在参加一个金融科技峰会时，与一位银行代表进行沟通。他提出金融机构做AI大模型，最根本的动力是担忧。在移动互联网时代来临前，全球金融行业普遍低估了新技术带来的冲击力。随后被Apple Pay、支付宝、微信等移动互联网平台分润了时代红利。不让类似境况重演，是驱动金融机构加码AI大模型的底层动机。

如果是这样的话，金融行业仅仅快步走向大模型并不够，同时还需要听见远方的风，要能够从长期目标来回溯中短期的行动规划。

今天，我们就从这个观点出发，聊聊快速用上了大模型之后的金融行业，接下来走向何方？

金融大模型，从高速覆盖1.0，走向价值最优2.0

从全球到中国市场，生成式AI带来的大模型之变，都在一年多的时间里掀起了金融行业的科技革新浪潮。

在国际上，OpenAI将金融行业视为GPT技术落地的首站，比如其与摩根士丹利合作，推出了基于 GPT-4的投资顾问机器人。

而在中国金融行业，AI大模型可谓以前所未有的态势得到了高速覆盖。在短短一年多的时间里，处于头部地位的银行、券商以及保险机构纷纷完成了金融大模型的落地应用。

比如说，工商银行就宣布建成了同业首个全栈自主可控的千亿级AI大模型技术体系，并在多个金融业务领域实现了创新应用。例如在网点运营上，推出了基于大模型的网点员工智能助手。农业银行AI推出了类ChatGPT的AI大模型应用ChatABC，并在科技问答场景进行了内部试点。邮储银行通过接入百度“文心一言”，从而在智能风控、智能运营、智能投研、智能营销等场景进行大语言模型应用。

在民营银行层面，网商银行将大模型技术应用于产业金融层面，从而识别小微企业的信用画像。在保险行业，众安保险搭建了“众有灵犀”系统，将大模型带入智能客服、到期提醒、智能运营等业务场景中。

而从技术与解决方案供应商的层面看，目前中国市场已经呈现出多样化的金融大模型技术供应渠道。腾讯云、蚂蚁金服都推出了金融大模型解决方案。面向金融行业既需要大模型落地，同时也需要基础设施更新的需求。华为在2023年依托盘古大模型，推出了金融级PaaS解决方案，发布了包括AI for Data、AI for Business、AI for IT三大类10个场景的金融大模型方案。

而在开源大模型层面，度小满开源了轩辕大模型，其在1760亿参数的Bloom大模型基础上训练而来，已经应用在度小满各个业务场景，覆盖了从营销、客服、风控、办公到研发等场景，并在一系列大模型评测中取得了领先地位。

可以看到，金融大模型已经快速走过了以高速覆盖为特征的1.0时代。在第一阶段，金融大模型相关技术与解决方案快速出炉，头部金融机构竞相试用，为中国金融大模型的发展打下了良好的基础。

金融大模型第一阶段的发现成果显而易见，比如说，技术发展速度快，用户积极性高。同时金融大模型的业态覆盖非常完整，从银行到保险、证券等领域兼顾，此外相关的技术能力供应链已经完善。闭源模型与开源模型兼顾，多种部署方式完备，与金融大模型相配套的软硬件基础设施已经较为齐全。

但在接下来，金融大模型需要从具有探索性质的1.0阶段，走向必须要求回报率，要体现长期发展价值的2.0阶段。

这一阶段，金融大模型需要面临的挑战更加复杂，同时战略方法论的问题也将浮出水面。

已经暴露出的挑战

统观金融大模型的落地进程，会发现其中表现出的优劣势逻辑，与此前AI技术落地金融业如出一辙。第一阶段，行业会直观感到AI很好用。但接下来，AI能否带来充足的投资回报，能否深入业务核心，才是更大的挑战。

目前，金融大模型也遇到了类似问题。首当其冲，大模型所带来的智能幻觉、数据污染等问题，与金融行业对专业性、安全性的极高需求是难以匹配的。

其次，由于金融行业极高的涉密等级与安全合规要求，往往需要私有化进行大模型部署，同时禁止模型学习大量数据，禁止数据过分流动。这又催生了两个问题，一个是私有化部署给金融机构带来了极大的研发与运维成本压力。另一个是高安全等级与限制数据使用，带来了金融大模型效果不佳等问题。

对于金融机构来说，不仅是研发、训练大模型的成本过高，将模型进行场景化部署的成本压力也很大。由于目前金融大模型还处在探索阶段，难以带来实际的商业回馈，因此其部署往往是在机构内部，或者边缘业务中。这就导致部署成本不断放大，但商业化价值却迟迟无法释放。

最后，也正是处于金融行业高安全，与大模型技术不够成熟二者间的差距。金融大模型普遍无法在金融核心业务中进行部署。比如大模型加持的智能客服，不仅无法代替客服人员，还可能出现需要频繁唤醒人工客服，且需要客服重新理解用户需求的现象。而在风控等产业应用侧，大模型虽然表现出了巨大的潜力，但还无法真正处理较为复杂的风险异常。

这种情况下，金融大模型很可能在运行一段时间，热度相对褪去之后，又和许多金融科技一样流于边缘化。

如何才能突破技术与产业之间的长期壁垒？这可能需要金融大模型听到一些来自远方的风。

从未来，回看现在

布莱特·金在著名的《银行4.0》中，第一章就在讨论第一性原理的回归。即我们需要回归问题的本源，回归设计的本质。放在金融场景，就是我们首先需要理解银行被设计出来是为了什么，继而在讨论银行应该如何发展。

想要打破金融大模型可能面对的壁垒，我们也必须有这样一个意识：去思考，去判断，甚至去假设未来大模型究竟能给金融带来什么，再从未来倒推现在。

哪怕这个未来相对遥远，至少远方的风不会带我们走进死胡同。

那么，AI大模型到底能为金融带来什么？

这个问题可以分为两个维度去理解，一个是技术维度，一个是应用维度。

从技术上看，大语言模型的技术升级路径已经相对确定，业界对其技术发展范式以及工程化实践已经有了明确的共识。

比如说，最近我们读了由度小满金融技术委员会执行主席、数据智能应用部总经理杨青所撰写的《大语言模型：原理与工程实践》。书中除了明确提出了大语言模型的多项关键技术之外，还指出了其在涌现能力、推理能力上的特点，以及广受关注的大语言模型缩放定律。随着模型训推能力的提升，大语言模型将持续出现智能涌现效果。这一技术锚点是金融行业所追寻的长期价值，也是度小满等金融科技供应商探索大语言模型的价值关切。

而从应用维度看，目前金融大模型的应用场景繁多，但归根结底可以总结成三个方面：

面向大众用户的智能客服－智能顾问。
面向产业用户的智能信贷识别－信用体系构建。
面向金融机构内部的职员能力提升。

这三种能力的极致化，就是金融大模型可能带来的长期价值。比如在未来，以大语言模型驱动的智能客服，可能会变成智能顾问、一对一的金融服务专家。不仅可以完成业务对接，信息告知等基础功能，还可以结合用户需求给出定制化的金融方案，实现金融订制能力从大额用户、企业用户向普惠用户的转变。

将技术维度与应用维度进行综合，我们可以将金融大模型的未来锚定在三个方面：

1.企业与个人信用服务的智能泛在化。

2.金融客服的少人化甚至无人化。

3.金融机构综合智能能力的极致化。

如果说，移动金融是把银行、券商直接开到了用户手里，是让金融距离用户更近，那么AI大模型金融，则是让用户走得更远，让用户的一切诉求与资产都可以与金融服务建立联接。

用远方的风，丈量现在的路

一段时间以来，金融大模型领域存在着务虚与务实的争论。

所谓务虚，是指金融机构应该更关注算法本身，关注模型性能，先上马大模型，拿着大模型的锤子找金融业务的钉子。

而务实则是要求从金融行业的应用场景出发，优先考虑金融应用智能化的安全合规与成本可控，在此基础上再去适配裁剪大模型的能力，让大模型为金融服务。

某种程度上来说，二者都有正确的因素，但或许也都可以补充新的思路。因为二者都更加关注短期抉择，忽略了金融大模型的出发点是行业的跨时代升级，是寻求像移动金融一样，甚至更加深刻的长期变革。

金融大模型需要补充的思路，就是务实务虚之外，需要务未来，需要从最终可能实现的理想化目标，来一步步推导现在的工作。让远方的风，吹动现下的脚步。

从这个角度看，金融机构就需要兼顾上马大模型的效率，同时兼顾未来可能随时出现的更多AI技术创新。让自身的数字化架构与软硬件基础设施，适配随时会到来的AI技术迭代。具体来看，“务未来”的金融大模型，可能包含以下三层行动：

1.打好金融大模型基座。其中包括自身的研发体系，也包括与技术供应商之间开放有效的合作关系，避免因过度保守而遭遇技术搁浅。

2.兼顾金融大模型的工程力与想象力。面向大语言模型的长期发展，金融行业不能局限于有大模型，更需要锤炼对大模型的工程化掌控力，随时可以将大模型锤炼成符合自身需求的状态，同时积极开启创造性的大模型探索。既在内部酝酿变革，也不放过外部机遇。

3.构建长期且清晰的智能化目标。对于金融大模型，我们要正视其短期的局限性，以及长期的可能性。在战略上回归大模型最本身的第一优先性原理，然后以此为目标倒推每一步的进展。

当大模型出现在金融业面前时，我们的第一感受都是惊喜与遐思。但在实际应用大模型时，往往会过于聚焦眼前，比如是否使用了大模型，覆盖的业务场景，以及带来的投资回报率。这时，浮现出的挑战以及不那么清晰的价值往往会滋生矛盾，让金融机构进退维谷。只要让远方的风吹进来，让金融智能化的长期主义映照现在，绝大部分问题都会找到解法。

P.s.本文写作过程中，《大语言模型：原理与工程实践》带来了许多启发与帮助，特此感谢。