对话翼方健数罗震:天下无难用的数据,如何让“机器人医生”更智能?
除了安全计算之外,罗震在数据透明、差分隐私、云计算等做了详细阐释。
比如说常见的数据透明,对于平台数据内个人的信息脱敏处理,但是无法解决所有问题。因为在大数据的年代,当你对数据主体的理解足够多,甚至可以通过对其日常生活的了解,到平台找到这个人。
如何解决隐私保护问题,差分隐私是一套非常好的量化隐私保护的解决方案。这套理论体系内,我们将每一个查询中间的隐私法用量化的方式表达。可以在过程中比较精准的衡量平台用户做了career后,有多大的可能性定位到他想找的每一个人。平台可以通过一些加噪音的方法或限制的手段来防碍它。
此外,当我们在大数据的平台内做不同的计算,在很多底层技术使用等方面与云计算、区块链有很大关系。数据不出平台,当数据在内部会发生变化、计算产生新的结果过程中,可以利用区块链完整的记录数据演化的过程。
3
让天下没有难用的数据
这些问题我们认为是在隐私计算中可以考虑到极具挑战性且很有意思的技术问题。罗震认为隐私计算的技术范畴非常广泛,我们公司最主要想做的事情是想让大家把数据利用起来。
所以提出的口号是我们努力成为“数据和算法互联网”的推动者,建立一个由安全数据和计算(特别是AI应用);数据所有者、数据用户和服务提供商所组成的活跃生态系统。
Step1, 建立独立的隐私安全生态,将数据所有者的数据利用起来。如我们和地方卫计委合作,将来自于医院、妇幼保健、基层卫生等不同来源的数据,进行加工治理。
罗震列举团队在厦门做的落地案例。厦门17年是国家健康医疗大数据首批试点的4个城市之一。卫计委当时想把厦门的存量医疗数据开放出来,过程中,我们与厦门市卫计委搭建开放的应用生态,如今平台内已有大量的科研机构利用数据。
举例来说,厦门大学国家医疗健康研究院为新生儿重症病的人群,找到他们妈妈在怀孕期间的产检记录,和NIPT的数据结合做关联性的研究。这些事情在平台内完成,而全部做到需要多维度的数据。所以在平台中,如果把所有的数据都打通,就能够支持高质量的应用。我们将一些非结构化的医疗文本结构化,把中间结构化的信息提取出来,根据结构化的信息,结合一些诊断诊疗、检查检验的数据,然后用医生的实际诊断进行训练,可以产生类似像机器人医生的工具。
机器人医生的水平受几个因素的影响,一是老师的水平,二是学生的学习能力,三是最终机器人医生的水平。
举一个具体的例子,在一家医院内用他自己的数据训练出的模型做一个具体的应用,观察这家医院医生诊疗过程中整体以及个体表现。我们发现在模型训练的时候,以肺炎和支气管肺炎为例,它的 Top 1的符合率比较低,但是Top3符合率比较高,背后的原因是某院肺炎和支气管肺炎诊断经常混用,所以造成符合率不高。
我们整体的思路是,首先帮助有数据的人将数据治理好,通过隐私安全计算方式,在中间通过他的数据产生AI并且把AI通过一种能力的方式输出,改造现有的医疗信息系统,为医疗信息系统装上智慧的脑袋。
Step2,罗震介绍团队通过计算连接隐私安全计算平台,进一步发掘数据价值。
具体落地方面,在中国一些不同的城市中,我们先使用医疗数据,而后将它们相互连接起来。期间我们进行智能应用部署、将数据产生智能服务为医院质控,并将部署点与应用命名。另一方面与比如与第三方数据源合作,有地理位置信息数据的,做智能营销方面工作。
总结而言,形成中的数据和计算互联网(IoDC)。很多时候需要这样的信息帮助我们发现疾控中间的一些新发的创业热点,通过有机的计算和数据的建设、网络的建设,最终实现将各个点连起来,实质是开放的生态。
所以我们现在和比如像微众银行、蚂蚁链做合作,在区块链上采用大量第三方技术,同时我们热切期盼更多生态合作伙伴一道加入,充分挖掘数据价值。
最新活动更多
-
即日-1.24立即参与>>> 【限时免费】安森美:Treo 平台带来出色的精密模拟
-
2月28日火热报名中>> 【免费试用】东集技术年终福利——免费试用活动
-
即日-3.21立即报名 >> 【深圳 IEAE】2025 消费新场景创新与实践论坛
-
4日10日立即报名>> OFweek 2025(第十四届)中国机器人产业大会
-
7.30-8.1火热报名中>> 全数会2025(第六届)机器人及智能工厂展
-
即日-2025.8.1立即下载>> 《2024智能制造产业高端化、智能化、绿色化发展蓝皮书》
推荐专题
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论