《数据安全法》正式实施:隐私计算开始群雄逐鹿
UCloud的安全屋作为上海普惠金融平台开放数据流通的重要解决方案,为普惠金融提供了较好的数据安全管控的基础,而其中的关键就是“数据沙箱技术”。
所谓的“数据沙箱”,指的是一个虚拟环境,特点就是不能运行任何本地的的可执行程序,不能从本地计算机文件系统中读取任何信息,也不能往本地计算机文件系统中写入任何信息。
那在这种特殊限制环境下,如何又让数据充分的为下游所用呢?
这就是“数据沙箱”的魅力,结合云平台和数据交换技术,提供访问控制、数据脱敏、安全审计、数据分级管理,在保证系统数据安全性的同时,实现数据价值挖掘。
举一个例子,在UCloud的数据沙箱里,资源申请方通过数据沙箱对数据进行计算,得出所需计算结果,但却不触碰数据本身,严格确保数据的所有权和使用权分离。
这一解决方案因为符合典型的政府提供公共服务的特性,后来被运用在多个地方政府的大数据服务项目中。还有一个可想象的场景是,针对有跨境流通需求的数据,也可以使用安全屋解决方案,在不流通数据本身的情况下,有限定地输出计算结果,为数据安全流通监管提供技术支持。
第二个场景,是医疗场景。大家知道,医疗数据具有很高的价值,比如可以用于医保控费、保险精算、AI诊断算法的训练等,是现代医疗、医保体系都非常需要的数据源。
但和第一类可汇聚、相对简单的公共数据来说,医疗数据的第一个特点是不可汇聚(可以简单理解为,数据分布在不同医院),在这种情况下,数据沙箱就无法解决问题了。
无法解决的原因很简单,第一是医疗数据的隐私性极高;第二是,医疗数据的用途(保险精算、疾病研究)中对算法的复杂度要求不高,但由于是涉及生命的数据,所以对精度要求极高,这一点用数据沙箱无法完美承载。
在这种进阶需求的情况下,UCloud在安全屋解决方案中加入“安全多方计算”技术,以满足这一类场景的需求。
安全多方计算起源于1982年著名计算机科学家姚期智提出的的“百万富翁问题”,简单说,就是在假设第三方不可信的前提下,如何安全地计算一个约定函数的问题,这其中的基础之一是密码学。
考虑到篇幅,我们不再介绍更多的细节,简言之,安全多方计算上具有高度的数据安全,虽然在性能上会有一部分损失,但融合安全屋技术基础,可很好地满足跨医联体协同的问题,所以正好和这个场景下的需求,很好的对应起来。
第三个场景,是数据源。主要是多媒体影像的时候,这些数据的量很大,而且,一般都要引入AI算法,例如通过摄像头采集数据后,再进行动态影像的抽取和识别,这种情况下计算的复杂度会很高,不适合对算力性能有消耗的多方安全计算,。
通过实践积累,UCloud在安全屋解决方案中同时引入联邦学习技术。
联邦学习,又名联合学习、联盟学习,它的本质是一个机器学习框架,能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模。
简单来说,两个机构各有一部分数据,比如腾讯有社交数据、阿里有电商数据,但是它们不能也不愿意把双方数据进行合并,联邦学习,就可以通过加密机制下的参数交换方式,建立一个虚拟的共有模型,通过算法的分发,在数据不移动,不泄露,也不影响数据合规的前提下实现共同分析。
同理,这种方式也适合不同的高校科研机构,例如对医疗影像资料等具备很高科研价值的多媒体数据开放流通
简而言之,UCloud安全屋从最初的数据沙箱技术演进为如今的三大技术平台,服务客户的领域也在不断扩大,从政府、金融,到医疗、教育等。在这背后是各行各业对数据开放流通的态度在转变,越来越多行业愿意通过成熟的解决方案拥抱开放,通过加速数据流通创造价值。
所以,在我们可以想见的未来,不仅UCloud的安全屋已经从最早的单一的平台发展到隐私计算系列三大平台,彼此相辅相成,其它致力于隐私计算的企业也会延伸出更多的场景和解决方案,那么,究竟哪些从事隐私计算的企业会在市场上更有竞争力?隐私计算的商业模式和商业价值又有哪些可以进一步挖掘的空间呢?
3
群雄逐鹿
通过几年累积,今年,隐私计算开始真正进入大众视野。
无论是政策文件的密集发布,还是资本的扎堆入场,都在传递着同样一个信号,那就是隐私计算这个细分领域已经迎来了风口。Gartner发布的报告显示,到2024年,隐私驱动的数据保护和合规技术支出将在全球突破150亿美元,也就是说将成为一个千亿级市场。
事实上,目前隐私计算领域已经形成了“一强四小龙”的初步格局,其中的“一强”是国内较早研究、并应用隐私计算、已经有多个跨行业解决方案的UCloud,而“四小龙”分别指蚂蚁金服、微众银行、翼方健数和华控清交。
2018年6月,华控清交由清华大学发起成立,创始团队主要来自清华,公司首席科学家是清华大学金融科技研究院副院长兼区块链研究中心主任徐葳,核心技术骨干则来自清华大名鼎鼎的“姚班”,而姚班的创立者就是我们前面说的提出多方安全计算设想的大名鼎鼎的计算机大牛姚期智,可谓根正苗红。
蚂蚁金服、微众银行和华控清交的重合之处在于,它们都布局在金融赛道;而翼方健数则走了与其他三家不同的路线,将业务重心放在对隐私计算同样有较大需求的医疗赛道,前文也提到了,医疗场景对于多方安全计算、联邦学习都有巨大的需求。
另一类竞争者是传统的安全公司,他们可能从安全切入,确保整个数据的安全。
但是真正值得重视的,还是云计算背景的企业。即使如蚂蚁金服、微众银行,其背后也是站着阿里云、腾讯云,至于UCloud则是国内云计算第一股,以中立云而闻名。
为什么隐私计算离不开云计算?这是典型的场景倒逼。
云计算企业有三个比较突出的特点,其中首要特点就是——云计算企业在长期服务用户的过程中,更加了解用户的数据使用场景,有结合场景来开发产品的优势;
云计算企业开发隐私计算技术的第二个特点,是无论我们说的数据沙箱、多方安全计算、联邦学习等中的哪一种,本身都是大数据技术的一种,底层都需要有数据的大量的存储、分析、计算的能力,与云计算公司本身具有的计算、大数据、人工智能等技术具有很高的契合度;这是专门搞算法、搞安全的隐私计算创业公司所不具备的场景。
另外很重要的一点,就是我们前面谈到的,数据要应用,薄弱环节在于流通,但并不是说储存环节就不需要安全能力,所以技术过硬的云计算厂商,本身具有安全能力的积累,这比某些专门做隐私计算的企业,更有底层安全保障。
这个行业的规律往往是,从实际需求出发的技术创新最能切合实用。比如腾讯有大量社交需求,所以音视频技术能力不断得到强化,可以复用在文娱、游戏甚至是腾讯会议这样的业务里;阿里有电商业务,所以关注云计算,以及金融科技赛道科技创新,所以有了蚂蚁金服;UCloud则因为创始人出身背景,一直追求差异化竞争等企业定位,非常关注云上数据安全,延伸到数据开放流通领域,就有了安全屋……所以笔者认为,隐私计算赛道的下一个竞争重点,一定是有云计算背景的企业、垂直隐私计算研发的企业和传统安全企业的“三国大战”。
而这场大战值得期待,因为这不是基于烧钱的营销竞争,是实实在在比拼技术创新能力的竞争,这种竞争越激烈,我们技术进步就越快。
而这场竞争,离不开与商业模式的结合。
从目前看来,隐私计算至少有三种商业模式有待探索。
第一种商业模式,提供底层技术服务。就像UCloud用“安全屋”,为上海、厦门的地方政府提供政府数据开放的安全服务,成为底层技术服务平台,通过平台服务费的方式来收费,这是最原始也是最确实的一种路径。
第二种商业模式,是不仅仅做平台,还把隐私计算技术拿出来产品化,其中既可以是像安恒这样的安全公司,推出的数据安全咨询服务体系等主打安全的产品,也可以像UCloud、百度智能云这样本身有大数据分析和人工智能专长的企业,把隐私计算+云计算+大数据/AI能力根据场景整合起来,形成类似深度学习平台这样的体系,从底层模型到开发套件、低代码工具、云计算套餐等整合起来,为广泛的生态用户提供强大而灵活的应用及二次开发能力,是大平台”型模式,这种模式可以很好的解决第一种模式模板化的服务能力,是真正隐私计算的普及之道。
第三种模式更有想象力,就是做大数据交易平台。2020年4月,《关于构建更加完善的要素市场化配置体制机制的意见》正式发布,为推进数据要素市场化改革指明了方向;今年3月,北京国际大数据交易所正式成立,深圳等城市也相继发文规划设立交易场所进行大数据交易。伴随着《数据安全法》的实施,数据确权等问题开始有法可依,为保护数据资源的安全和可交易,提供了法律依据,这是面向未来、高度有想象力的一种数据交易模式。
目前,大数据应用的成功案例主要集中在欧美发达国家,国内外大数据产业差距较大。但从应用场景和社会数字化建设程度来说,国内的后发市场拥有很多优势,是一个非常有潜力的市场。国内蓬勃发展的大数据产业,一定会让中国的数据流通产业迎来更大发展机遇。受到市场需求推动的数据安全流通技术和产品,势必会在挑战和机遇中迎来快速发展的机遇,赶超全球先进的技术。
这是一个属于技术创新和商业创新叠加的新时代,希望中国的隐私计算能找到自己的星辰大海。
图片新闻
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论