春节特辑 | 隐私计算在金融领域应用发展报告2021
(三)瑞莱智慧
瑞莱智慧是零壹财经在调研中发现的一家具备硬核科技创新实力的公司,在隐私计算技术方面取得了重大的创新突破。
瑞莱智慧成立于2018年7月,孵化自清华大学人工智能研究院,是全球领先的安全可控人工智能基础设施和解决方案提供商。团队由中国科学院院士张钹、清华大学人工智能研究院基础理论研究中心主任朱军共同担任首席科学家。目前,公安部、多家股份制银行、头部城商行等都是瑞莱智慧的合作伙伴。
2020年12月,瑞莱智慧首次发布了隐私保护计算平台RealSecure。
1、RealSecure技术特点
隐私保护计算平台RealSecure是一款数据安全共享基础设施,通过将计算移动到数据端,打通数据孤岛,实现数据可用不可见,解决跨机构数据合作过程中的数据安全和隐私保护问题,驱动联合风控、联合营销等金融场景业务增长。平台主要包括安全多方计算、联邦学习与匿踪查询三大功能模块。
图:瑞莱智慧隐私计算平台RealSecure
RealSecure平台具备以下优势:
首先,RealSecure是业内首个“活字印刷”级隐私计算平台,搭载了瑞莱智慧自主研发的联邦AI编译器。一般开发过程中,大部分隐私计算的技术栈在遇到不同机器学习算法时,需堆人力逐个进行安全加密改写,被视作一项“劳动密集型”工作。瑞莱智慧通过对人工智能和密码学底层原理的融合突破,实现“一键改写”,首创“底层数据流图”实现自动编译,集成新机器学习算法(例如SVM, Matrix-Factorization)时,无需针对每个参与方编写对应的计算逻辑,同时支持适配上层多种机器学习算法,极大提高了易用性与可扩展性。
第二,RealSecure革命性地使用了全同态加密技术,实现性能和安全性的双重提升。一般来说,全同态在加密和计算方面比半同态会更耗时,但瑞莱智慧利用SIMD(全称Single Instruction Multiple Data,单指令多数据流)技术对多条数据进行同时处理,在整体上实现比半同态方案更快的效果。通过编译器驱动高效加密算法的优化,隐私保护下完成全流程建模,总耗时从日级别缩短到小时级别,领先业内平均水平数十倍。同时基于格密码的加密方案能够对抗量子攻击,比传统半同态方案具有更高的安全性。
第三,直观可验证的安全性。传统隐私计算模式的安全性依赖于“专家验证”,无法做到自动验证。RealSecure则通过把联邦算法协议抽象为中间层表示(IR),以数据流图的形式直观展示加密过程,底层执行的计算公开可审计,同时深度结合密码学证明,支持完整证明联邦算法协议的安全性。基于此,瑞莱智慧也构建了严谨且可论证的“事前”“事中”“事后”安全体系,提供“协议模型及安全性假设、技术实现原理、数据抓包监测、运算日志打印审计”全方位的安全评估验证。
2、RealSecure应用案例
2.1横向反欺诈建模及黑名单共享案例
(1)业务背景
银行的风控能力一直被视为核心能力,但相较于大型银行,中小型银行在风控技术和经验上一直处于劣势。一般来说,各银行在自身业务的开展过程都会积累沉淀黑名单,用来在前置风控环节识别并剔除不良用户,但对中小银行来说,因为其业务开展的时长及覆盖的客户有限,积累的黑名单普遍较为局限,难以用于精准高效的识别不良客户。而且中小行积累的欺诈样本不足,无法支撑其构建效果优良的交易反欺诈模型,导致行方反欺诈工作开展的效果一般。
在此背景下,中小银行迫切希望能够获得其他金融机构尤其是同类银行的黑名单以及欺诈样本数据,实现自身风控能力的提升。但随着《数据安全法》、《个人信息保护法》等政策的相继出台,银行机构之间的数据输出与共享受到限制。
(2)解决方案
为应对以上痛点,瑞莱智慧基于RealSecure平台提供了“横向反欺诈建模及黑名单共享”解决方案,帮助各家中小银行在安全合规的前提下实现黑名单的共享、金融联盟风控反欺诈共建。
1)横向联邦反欺诈
具体实施中,参与的银行方需部署RealSecure平台节点,实现互联对接。项目前期以银行A和银行B作为试点进行方案的落地。
图:RealSecure横向联邦交易反欺诈示意图
基于RealSecure平台,银行A和银行B分别准备相关反欺诈样本数据,包括标签和特征,上传至隐私保护计算节点,通过横向联邦的方式,基于双方银行准备的反欺诈样本数据进行特征对齐及建模。在双方数据可用不可见的情况下,构建效果更优的反欺诈模型。
2)黑名单共享
具体实施中,由某大型股份制商业银行牵头,与N家银行分别各自部署RealSecure平台节点,基于匿踪查询技术分别为对方提供隐私黑名单查询服务,如下图所示。
图:银行间基于匿踪查询技术查询黑名单示意图
匿踪查询是在发起方不暴露查询ID的前提下,能够获得该ID在其他机构的信息。在黑名单共享场景中,ID为用户三元组,待查询的信息为是否在黑名单中,通过同态加密技术,对ID和信息进行加密,并对外提供黑名单服务。查询方可获得黑名单信息的密文结果,并且仅能解密查询方发起请求的用户ID的黑名单标签值。
在实际业务中,银行一要判断一个用户是否是黑名单用户,首选会以用户ID作为Key,在本地查询该用户是否在黑名单内,若命中,则返回。若未命中,则通过匿踪查询技术,向银行一、银行三、银行四查询用户ID是否在在黑名单内,返回结果。业务流程如下图所示:
图:运用匿踪查询技术查询黑名单业务流程图
(3)方案效果
表:应用RealSecure前后银行反欺诈效果差异
模型效果方面,在横向联邦反欺诈场景中,银行A、银行B在本地构建的模型,AUC值分别为0.71和0.72,KS值为0.31和0.32,而通过RealSecure平台构建的模型AUC和KS分别是0.74和0.35,一定程度上为行方反欺诈业务带来了显著的指标提升。性能方面,银行A和银行B分别提供百万级别的训练样本,平台每进行一次联邦建模的总耗时仅在分钟级别内,接近模型本地训练的性能。
(四)金智塔科技
在零壹财经调研接触的案例当中,金智塔科技的隐私计算产品是屈指可数的由国家重点研发项目转化的成果。金智塔科技由浙江大学人工智能研究所和浙江大学互联网金融研究院联合孵化的国家高新技术企业,是国内领先的隐私计算行业服务商,致力于大数据和隐私计算领域的技术攻坚,为金融机构、政府、大型企业提供数字化转型解决方案,拥有三十余项专利和软著并先后通过CMMI3、ISO9001、ISO27001、工信部隐私计算评测等资质认证。公司由斯坦福大学访问学者、浙江大学人工智能研究所博导创立,核心团队来自浙大、阿里、蚂蚁、网新、同花顺、挖财,具有丰富的实践运营经验。
1、金智塔隐私计算解决方案
“金智塔”隐私计算平台是国家重点研发项目“大数据征信及智能评估技术(2018YFB14030003 )落地成果。
金智塔科技作为早期得到国家重点研发项目支持,开展多源多模态数据融合与跨域联合建模的企业,与浙大、清华、北邮、中科院、国家计算机网络与信息安全管理中心、浙江省农信联社等共同研发打造“大数据征信服务平台”,平台已汇聚包括征信、房产、发票、知识产权、移动运营商等海量权威数据合作伙伴,同时结合公司丰富的行业经验,平台内嵌了支持多应用场景的常用联邦学习和多方安全计算模型,实现了数据分级分类管理、数据质量审计、模型效果审计、数据应用存证等数据安全与隐私保护全流程管理。具有节点扩展成本低、部署迭代便捷、运算效率高、算法扩展灵活等优势。经工信部信通院最新评测结果表明,全部指标位于行业头部,部分指标位居第一。
目前该平台已在金融智能风控与智能营销、政务数据合规共享、传统产业数据资产建设与数字化转型等领域实施运营,助力数智化应用,推动数字经济发展。
图:金智塔隐私计算平台框架
此外,由于学术背景深厚,金智塔科技在基础研究方面实力较强。金智塔科技目前为2021年人民银行杭州中心支行研究课题《金融科技伦理发展背景下的数据治理问题研究》。项目研究成果将推进央行金融数据综合应用试点,推动金融科技伦理体系建设及数字治理高质量发展。
2、金融科技实战经验丰富
在进入隐私计算领域之前,金智塔科技在金融科技的实际应用方面积累了丰富的经验,这也为金智塔科技的隐私计算产品在金融场景中更好地落地打下了坚实的基础。
2019年5月,金智塔科技推出“知他”一站式大数据分析建模服务平台,运用大数据、人工智能技术,深入业务场景,实现在营销、风控、运营等方面的智能化应用,推动金融机构数字化转型。这是金智塔科技在为多家银行提供建模的经营积累基础上搭建的平台,提供营销和风控两大类模型。
基于这个平台,金智塔科技推出一些列产品,包括“知他”企业贷款、“知他”房产贷、“知他”房产贷、“知他”智能营销、“知他”智能建模、“知他”大数据建模平台。
3、落地成果与未来展望
金智塔隐私计算平台经过多年技术积淀,不仅服务于金融领域,同时也在智慧政务、智慧产业等领域产出丰富落地应用效果。
金融智能领域,已将基于金智塔隐私计算的联合智能授信推广到数十家农商行、城商行和股份制银行,取得了良好的社会效益和经济效益。同时,还为多家机构开发了联合智能营销解决方案,受到了金融机构的欢迎。
智慧政务领域,金智塔隐私计算平台通过与省市数据管理部门和业务管理部门合作,在政务部门内部数据共享、数据交换、数据校验等方面提供隐私保护技术支持,同时为政务数据的社会开放提供解决方案。
智慧产业领域,金智塔隐私计算平台依托其技术优势,积极赋能传统产业转型升级,近年来在零售企业智慧选址、销售预测、智能营销推荐等领域逐步积累经验,助力企业数据资产建设,赋能企业数字化转型。
(五)天冕科技
天冕科技是金融科技集团WeLab汇立集团旗下一站式金融科技服务商。在入局隐私计算的厂商当中,天冕科技是有深厚智能风控业务积累的非常典型的厂商。
金融科技集团WeLab汇立集团创立于2013年,运营亚洲首批持牌虚拟银行——WeLab Bank(汇立银行)以及提供其他纯线上消费金融服务。在过去八年中,WeLab汇立集团自主研发的多维度风控系统WeDefend在业界已经颇有声望。
早在2017年,天冕科技的前身、WeLab汇立集团旗下一站式金融科技服务商“天冕大数据实验室”已经开始密切关注隐私计算的进展,并于2019年启动研究,2020年下半年开始尝试将隐私计算产品落地。
天冕科技的隐私计算服务有几个显著的特点:
第一,有硬核科技支撑。隐私计算技术的应用,技术难度较大,需要硬核科技的支持。厂商要在场景中做好服务,是对自身科技实力的考验——因为在场景应用中,有不少复杂难题需要解决,要解决这些问题,必须将技术中的难点攻克。
天冕科技的隐私计算业务一直坚持自主研发和创新,目前在隐私计算方面已经积累了11项专利。
表:天冕科技隐私计算相关专利列表
资料来源:天冕科技
这些专利聚焦于解决技术应用过程中的复杂难题。这些难题主要分布在三个方向上,即如何提高产品的安全性、性能和效果。
天冕联邦学习平台就应用了多项业界首创技术,譬如支持轻量级、一键部署的计算框架——函数计算。具体来说,市面上现有的联邦学习产品,其计算框架层大部分集成的都是计算引擎Spark(Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎),使用Spark可为建模过程中提供高效的运算,但是部署一套Spark集群相对来说,比较耗时、耗力,且大部分情况是使用云服务器,从而导致联邦成本比较高。WeFe平台另辟蹊径首创支持在为用户提供Spark集群的基础上,还可选择使用函数计算,从而实现弹性计算,动态扩展资源,节省成本、提高效率。
再比如,其中一项专利是“基于联邦学习的建模数据集推荐方法”。
联邦学习是由多方参与进行联合建模,在建模过程中需要联邦成员去根据各方的数据集简述,选择各方都认可的数据去进行联合建模。这种数据集简述比较片面,只能反馈一个大概,没有建模成功的案例参考,在双方认可后需要反复去建模尝试才找到自己满意的数据集,这样导致参与各方建模效率不高。
“基于联邦学习的建模数据集推荐方法”,通过对用户自身画像和每次建模后的结果记录以及反馈进行权重划分,计算出一个用户评分,根据用户所属领域、数据类型等条件进行评分排序,将评分较高的可用数据集推荐给需要进行联邦建模的参与方。这样做可以使建模各方能够快速找到需要去建模的数据集,并且能够快速的达到建模效果,减少建模的尝试次数。
这种方法可以将匹配率高的数据集推给参与方进行建模,方便各参与方选择匹配的数据集,提高建模效率。
第二,有丰富的智能风控经验。
过去八年,WeLab汇立集团已经拥有近5000万用户以及超过700家企业客户。WeLab汇立集团自主研发的大数据风控系统WeDefend在业界已经树立了品牌。中国邮储银行的首个互联网信贷产品“邮e贷”正是与天冕科技合作推出。
目前,在用户侧,天冕科技已经与10多家金融机构建立了合作,合作的内容主要是联合数据提供方,在各方数据不出私域的情况下,进行联合风控建模和联合营销。
下沉市场是金融机构未来拓展新客户的关键,而对下沉市场风控的把握正是WeDefend的强项。
风控经验在金融隐私计算的应用中非常关键。数据在金融风控领域的应用非常复杂,哪些数据和算法对提升实际业务价值最大,这些数据和算法应当如何运用,只有通过大量的实际业务运行才能掌握。同时,在实际应用中,如何从大量的数据提供商中挑选中真正优质的供应商,也是必须用真金白银和长时间的经验教训去换取的。
第三,“开包即用”,采用低学习成本、简易的可视化操作。
早期的隐私计算产品,使用起来比较复杂,需要编写代码。但是天冕科技的隐私计算平台实现了可视化操作,极大地降低了产品的使用和操作门槛,使得许多初级的算法和建模人员也能很方便地应用产品。
图:天冕联邦学习平台WeFe操作界面
资料来源:天冕科技
第四,将性价比做到极致。
在让产品好用的同时,天冕科技穷尽一切努力降低产品的价格。要将产品的性价比做到极致,是对厂商巨大的考验,这需要隐私计算厂商将那些经过实践检验最有用的产品功能做到最好,同时还要舍弃产品的很多设计,将价格降到最低。
比如,现在有隐私计算厂商开发出许多看上去非常酷炫,然而在风控实战中不一定能用到的算法,因为其大幅度提高了产品的价格。天冕科技则主要输出那些在风控实践中被验证过的最有效的算法。
再比如,现在要优化隐私计算的性能,有非常多的途径可以做到这一点。其中,用加速卡和专用芯片提升性能的成本较高,天冕科技优先采用了成本更低的通过GPU加速的方法。
隐私计算在金融市场的推进节奏
2021年,隐私计算开始在真实商业场景中全面落地。但是,这距离隐私计算市场的全面爆发还有距离。
根据零壹智库的调研,我们目前看到的原因有如下几个方面:
第一,是隐私计算技术自身的原因。
首先,性能的提升需要时间。
对隐私计算的大规模商业化应用来说,隐私计算性能的提升至关重要。因为它决定着隐私计算的数据处理效率,进而决定着隐私计算进入实际应用场景的可行性。
但是,性能的提升不是一蹴而就的。一方面,性能的提升需要大量的资金投入,对许多团队来说,需要兼顾商务落地与技术提升,即边赚钱、边研发,因此这将是一个根据实际需求的渐进的过程;另一方面,性能的提升也是由需求拉动的。隐私计算目前尚处于市场开拓初期,应用场景比较简单,处理数据量还不大,未来应用越来越多,需要处理的数据规模越来越大,对算力、性能的需求会更强。
其次,隐私计算的安全性要建立标准、赢得市场信任还需要时间。对于隐私计算的安全性,目前行业内缺乏统一的标准。目前,市场上已经出现一些不规范的操作,这有可能使得隐私计算在赢得信任方面走一些弯路。
再次,从业务效果来说,由于数据流通市场尚未成熟,所以数据的开放程度仍然有限,导致具体业务场景中可应用的数据资源也有限,这使得应用隐私计算技术为业务带来的提升效果目前还没法充分体现出来。
第二,是隐私计算产品价格与市场接受度的原因。
首先,目前隐私计算产品落地速度缓慢。虽然今年隐私计算平台开始规模化落地,但是总体来看尚处于初期,大多数厂商目前还处于一对一地为客户提供解决方案的阶段,产品还没达到可以大批量复制的程度。
其次,因为目前大多为一对一提供解决方案,所以隐私计算产品成本较高,这使得价格一时无法降下来。价格要降下来,需要产品达到可以标准化复制的程度才可以。
再次,隐私计算产品要被市场接受,需要经历一个市场教育的过程。零壹智库在调研中发现,不少金融机构的风控部门目前并没有意识到隐私计算能给业务带来多少提升。许多机构对隐私计算产品的采购,需要考虑其能带来的业务增量收益,要对比成本与收益。目前隐私计算的产品价格相对于收益来讲,对一些业务体量不大的机构还不太划算。因此,许多机构对是否采购隐私计算产品仍处于观望状态。
第三,从市场宏观环境来看,要分析隐私计算市场的发展,首先要看数据流通市场的发展,目前数据流通市场的发展尚未成熟。
目前,隐私计算厂商的收入主要是软件系统的销售收入,这只是隐私计算市场极小的一部分。未来,隐私计算更大的收入来源于数据的流通使用。因此,数据流通市场的成熟度,对隐私计算市场的发展至关重要。
作者目录
致谢
End.
原文标题 : 春节特辑 | 隐私计算在金融领域应用发展报告2021
最新活动更多
-
即日-11.13立即报名>>> 【在线会议】多物理场仿真助跑新能源汽车
-
11月20日火热报名中>> 2024 智能家居出海论坛
-
11月28日立即报名>>> 2024工程师系列—工业电子技术在线会议
-
12月19日立即报名>> 【线下会议】OFweek 2024(第九届)物联网产业大会
-
即日-12.26火热报名中>> OFweek2024中国智造CIO在线峰会
-
即日-2025.8.1立即下载>> 《2024智能制造产业高端化、智能化、绿色化发展蓝皮书》
推荐专题
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论