订阅
纠错
加入自媒体

逐鹿金融大模型

2023-08-11 10:17
零壹财经
关注

来源 | 零壹财经作者 | 沈拙言编审 | 赵金龙

在关于金融大模型的诸多讨论中,“落地应用”成了最终关键词。对金融业务而言,精准与安全合规是任何技术得以应用的最大前提。因此,金融大模型的应用便绝非简单的“拿来主义”,需要在通用基础上结合业务需求反复精调,这也是当前金融大模型的主要发力点。

7月末,据腾讯研究院副秘书长杨望调研分析,国内参数在10亿规模以上的大模型数量已由5月末的79个增加至116个,其中金融行业大模型约18个。

有观点认为,大模型的出现,可能会把金融机构的数字化转型进程拉到同一起跑线,填补金融机构间的“转型鸿沟”,这对中小金融机构来讲是不容错过的机遇。在保证信息精度与安全合规的前提下,抢先获得金融业务场景的商用突破,成为18家金融大模型研发机构竞争的决胜点。

 01 各显神通抢赛道

3月底,全球最大的财经资讯公司彭博社发布拥有500亿参数的大型语言模型——BloombergGPT,标志着全球首个金融大模型的诞生,也掀起了国内金融大模型的浪潮。

彭博社表示,该大模型在3630tokens金融数据集、3450亿tokens公共数据集之上进行训练,可全方位支持金融领域NLP(自然语言处理)任务,表现明显优于其他类似规模的开放模型,在一般NLP基准上的表现也达到甚至超过平均水平。

BloombergGPT一声炮响,给国内带来了实践方向。

图1:国内主要金融大模型时间轴(不完全统计)

来源:零壹智库

5月,大数据基础软件供应商星环科技推出第一款面向金融量化领域的生成式大语言模型“无涯Infinity”。据其介绍,无涯Transwarp Infinity支持股票、债券、基金、商品等市场事件的全面复盘、总结及演绎推理,以及政策研报的深度分析,为基金经理提供决策辅助。

5月下旬,度小满推出国内首个千亿级中文金融大模型“轩辕”,该模型是在1760亿参数的Bloom大模型基础上训练而来,聚焦于金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务。度小满CTO许冬亮表示,轩辕大模型基于度小满实际业务场景积累的海量金融数据进行训练,保证在提升金融能力的同时,不会损失通用能力。

6月,恒生电子发布金融行业大模型LightGPT。据其介绍,LightGPT使用了超4000亿tokens的金融领域数据(包括资讯、公告、研报、结构化数据等)和超过400亿tokens的语种强化数据(包括金融教材、金融百科、政府报告、法规条例等),并以之作为大模型的二次预训练语料,支持超过80+金融专属任务指令微调。

6月29日,拓尔思发布拓天大模型,并面向媒体、金融、政务领域推出了三大行业大模型。在金融大模型上,公司基于自有的110亿+金融主题数据、百亿级产业指标数据、30亿+产业要素明细数据、2亿+产业动态本体、500+以上标引维度、10000+知识标引规则、10万+产业标签作为专业训练数据。就在日前,拓尔思发布公告,计划募资18亿元用于拓天行业大模型研发及AIGC应用产业化项目。

7月,马上消费透露将正式发布自主大模型,聚焦“自主动态强化学习能力的大模型(AIGC+RLHF)、多种模型组合式的AI系统、多模态音视频实时人机结合”三项核心关键能力,致力解决金融行业大模型在落地过程中的安全可控和隐私保护、基础设施能力建设等方面的关键问题。

在金融大模型浪潮中,财富管理机构与运营商也不甘落后。海通证券、申万宏源、广发证券、兴业证券、长江证券、西南证券、国海证券、国盛证券、华福证券、财达证券10家券商宣布成为百度“文心一言”首批生态合作伙伴,以同花顺、东方财富为代表的财富管理运营商也公告称将重点打造AI投顾平台,深入AIGC、交互式AI等领域的研究,完善内容生态构建,增强智能运营能力。

腾讯云则瞄准金融安全领域,推出金融风控大模型,锚定机构交易、信贷、营销等场景的风控需求。腾讯云天御首席科学家李超认为,风控尤其是贷前风控环节有着最紧迫的需求,在信贷领域,因黑产造成的欺诈已经占到了整个逾期规模的40%-70%。

科大讯飞发布的大模型产品“讯飞星火智能客服”,以帮助金融机构提高客户服务效率和质量,提升用户体验为主旨。讯飞星火智能客服产品在意图理解能力、专业知识应用能力、对话设计与交互能力、个性化表达能力四个层面取得了全面提升,未来还会进行迭代升级,探索与金融场景更贴近、更有价值的技术服务。

文因互联公布了基于“文因大模型”联通多个金融场景的解决方案。根据介绍,该解决方案覆盖债权发行、IPO、ESG评级评价、智能投研、智能投顾、信贷评估、债券评级、合规审计、新闻写作、工业维修等多个场景,定位是“为金融人提供安全高效副驾驶”。

与产品相对应的是,一些行业标准也初露端倪。7月末,腾讯云与中国信通院共同启动行业大模型标准联合推进计划,双方宣布联合牵头中国首个金融行业大模型标准的编制工作。

据介绍,该标准对金融行业大模型的评估方法覆盖了投研、投顾、风控、营销、客服、银行、保险、证券等应用场景,并对大模型在数据合规性、可追溯性、私有化部署、风险控制等方面提出要求。

 02 应用层策略之争

金融大模型的应用与商业化同根同源,商业化是最终目标,应用是实现商业化的必要路径。

由于应用的方向不同,金融大模型所展现出来的能力也不同。按照模型能力输出的方式,具体可以分为中心化和非中心化两种方式。

中心化模式即企业调用通用大模型或第三方垂直模型的 API 去构建业务功能;非中心化模式则是企业根据使用场景和功能,以专有数据对通用模型进行微调,形成一个或多个基于实际业务的小模型。

腾讯云金融大模型的应用策略,是风控层面的从零到整。具体而言,针对金融机构动态化风控建模的需求,把专家经验抽象成一系列风控策略集,进而组成风控大模型,再以风控大模型应对假人假机、假人真机、真人假机的欺诈行为。

据报道,某金融机构的渠道和客群变化较快,基于传统的专家联合建模方式效率较低、成本较高,无法满足风控系统快速迭代要求,接入腾讯云行业大模型后,模型迭代周期从17天缩短到3天,建模效率提升60%。

这一做法与交叉信息核心技术研究院常务副院长林常乐的观点不谋而合。林常乐提出了大模型中的相关专业领域参数与专业模型相结合的技术路线,通过将专业模型的精度参数写入大模型,实现专业领域模型与大模型的衔接。

恒生电子与恒生聚源共同推出的智能投研平台WarrenQ-Chat,则是追求金融信息的精准度,用户通过对话指令,轻松获得金融行情、资讯和数据,且每一句生成的对话均支持原文溯源,确保消息出处可追溯。

科大讯飞“星火智能客服”则更注重以AI能力提升客户交互体验。据科大讯飞研究院副院长、金融科技事业部CTO 赵乾介绍,星火智能客服基于泛领域开放式知识问题能力、大模型和行业知识库及外部APP对接,可以解决新知识难更新、事实类问答容易“张冠李戴”等问题;通过情景式思维链逻辑推理,可为用户推荐个性化产品,赋能营销获客。

百川智能创始人王小川认为,大模型80%的价值可能蕴含在非中心化的模型和服务里。

 03 商业化将向何处?

据极客公园报道,有消息表示,随着监管明确,第一批合规模型放出是值得期待的。同时目前在 To B 领域的应用上,实际上已没有官方的合规要求,这将助推大模型落地企业,也将推动工具层和应用层发展。

但面向C端,合规先行是必然趋势。正如国家金融与发展实验室副主任杨涛所说,当人工智能大模型在金融领域应用时,更需关注大模型的可审计性、可解释性等难题以及参与金融活动引发的风险特征变化、数据保护、责任分担、合规边界等问题,并强化数据伦理、算法伦理、主体伦理、行为伦理等方面的治理。

中国工程院院士、复旦大学金融科技研究院院长柴洪峰认为,目前大模型在金融垂直领域仍未挖掘出涌现效应。

一方面,由于金融数据及知识的私密性导致难以共享,无法构建一个庞大的数据集,对此可以增强产学研的联动性,共同构建更强的金融垂直领域基座模型;另一方面由于金融数据模态更多,难以进行统一的处理建模,而如今的大模型对此种多模态的表达能力仍有待加强。

文因互联创始人鲍捷则提出了关于商业化层面的约束问题,金融客户并没有无限的预算,通常只有几十万最多几百万的前期投入。实际约束往往来自于分布式训练、数据清洗过程、提示词优化、各种数据格式,以及为达到更好的训练效果如何平衡全参数训练和提示工程的比例、降低成本,这都是需要在实际项目中解决的难题。

有从业者认为,当前金融大模型在商业化上的探索,最终的客户依然会落在中小金融机构上。从监管环境、市场竞争、数据安全等多个角度来看,头部金融机构都没有使用外部大模型的理由和意愿。

这意味着在头部金融机构自研的过程中,中小金融机构同已有的成熟大模型合作,争取到了一定的追赶空间,是补足数字化差距的绝佳窗口期。

同时,与中小金融机构的合作,也是考验大模型提供方在应用层中定制化能力的绝佳战场。

正如工商银行首席技术官吕仲涛所言,综合考虑投入和产出性价比,中小金融机构可按需引入各类大模型的公有云API或私有化部署服务,直接满足赋能诉求。

 04 重新定义金融科技

从定位上看,大模型对金融行业的质效提升,是过去金融科技的延续,但效果无限拔高,无异于开启全新纪元。

度小满CEO朱光曾表示,类似GPT这样大模型技术的出现,意味着所有围绕移动互联网、AI 1.0的竞争和优势正在告一段落。大模型技术将重塑多个行业的工作方式和格局,其中最明显的,也许就是金融业。换言之,大模型技术重新定义了金融科技。

也正是基于过去金融科技的应用积淀,吕仲涛认为短期内大模型与传统模型会共存,同时,大模型可作为中控,将传统模型作为技能进行调用。从长远来看,若大模型计算复杂度降低、可解释性增强,其综合性价比优势就凸显出来,大模型将逐步替代传统模型。

柴洪峰认为,金融垂直领域模型构建与金融数据的结合将成为推动金融科技创新和发展的重要动力,人机混合智能技术将成为推动金融领域进步的创新驱动技术。为了克服金融大模型应用现存的诸多难题,加强产学研的合作势在必行。

参考资料:1、"百模大战"回归理性!腾讯云牵头编制中国首个金融业大模型标准,力推这一业务

2、大模型百花齐放 负责任的金融领域大模型应用备受期待

3、文因互联鲍捷:数十万级、百万级投入,金融机构可拥有自己的行业大模型

4、沸腾 251 天,访谈近百位从业者,关于大模型世界的 5 个现状

5、如何释放大模型对金融行业的价值?

6、柴洪峰院士:大模型赋能金融科技思考与展望

       原文标题 : 逐鹿金融大模型

声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

    人工智能 猎头职位 更多
    扫码关注公众号
    OFweek人工智能网
    获取更多精彩内容
    文章纠错
    x
    *文字标题:
    *纠错内容:
    联系邮箱:
    *验 证 码:

    粤公网安备 44030502002758号