数据安全能力成熟度模型系列:数据处理阶段的数据脱敏过程
4. 制度流程
① 数据脱敏原则
有效性:要求经过数据脱敏处理后,原始信息中包含的敏感信息已被移除,无法通过处理后的数据得到敏感信息;
真实性:要求脱敏狗的数据应尽可能的提现原始数据的特征,且应尽可能多的保留原始数据中的有意义信息,以减小对使用该数据的系统的影响;
高效性:应保证数据脱敏的过程可通过程序自动化实现,可重复执行;
稳定性:数据脱敏时需保证对相同的原始数据,在各输入条件一致的前提下,无论脱敏多少次,其最终结果数据是相同的;
可配置性:可通过配置的方式,按照输入条件不同生成不同的脱敏结果,从而可以方便的按数据使用场景等因素为不同的最终用户提供不同的脱敏数据。
② 数据脱敏管理安全规范
美创科技专家认为一个完整的数据脱敏流程包括敏感数据识别、确定脱敏方法、制定脱敏策略、执行脱敏操作、审计及溯源等步骤。由数据脱敏管理部门负责数据脱敏整个流程的执行与监督。
敏感数据识别
在数据脱敏之前,应结合数据分级分类表对敏感数据进行识别和定义,明确需要脱敏的数据信息,一般包括个人信息数据、组织敏感信息、国家重要数据等。需要注意的是,有些信息本身可能并不是直接敏感信息,但是可用过与其他一些信息结合后推断出敏感信息,此时也应将此类信息纳入数据敏感的范围。
确定脱敏方法
根据应用场景和时间机制,数据脱敏方法可分为静态数据脱敏和动态数据脱敏。不同的数据脱敏方案对数据源的影响不同,脱敏时效性也不一样。组织机构应根据识别出的敏感数据的具体情况,确定合适的脱敏方法。
制定脱敏策略
组织机构应根据实际业务场景,结合行业法规的要求,制定相应的数据脱敏策略。
执行脱敏操作
根据已定义的数据脱敏策略、以及数据脱敏工作的流程和数据脱敏工具的运维管理制度,在实际业务运营过程中执行数据脱敏。
审计及溯源
在数据脱敏的各个阶段需加入安全审计机制,严格、详细记录数据处理过程中的相关信息,形成完整的数据处理记录,用于后续问题排查分析和安全事件取证溯源。同时,设置专人定期对脱敏相关的日志记录进行安全审计,发布审计报告,并跟进审计中发现的异常。
5. 技术工具简述
一个有效的数据脱敏工具应该包含两部分,一部分是可靠的数据脱敏技术,另一部分是合理的脱敏规则,这两部分是数据脱敏工具正常进行基本数据脱敏作业的基础。除此之外,数据脱敏工具需要有良好的适配性,能够应用在不同的环境下,如生产环境、开发环境、测试环境、外包环境等。同时还需要能够支持丰富的数据类型,针对不同的应用场景的的不同类型的数据,脱敏后不能破坏原有的类型和数据组成结构。
① 技术工具的方法和原理
数据脱敏技术工具可以分为两种,一种是静态脱敏,另一种是动态脱敏。静态脱敏和动态脱敏最大的一个区别标志就是在使用时是否是与原数据源进行连接。静态脱敏是将原数据源按照脱敏规则生成一个脱敏后的数据源,使用的时候是从脱敏后的数据源获取数据,静态脱敏一般用于开发、测试、分析等需要完整数据的场景。动态脱敏则是在使用时直接与原数据源进行连接,在使用数据的中间过程中进行实时的动态脱敏。动态脱敏一般用来解决在生产环境需要根据不同情况对同一敏感数据读取时进行不同级别脱敏的场景。
静态脱敏是利用截断、偏移、规整、替换、重写、加密等算法,对原数据进行脱敏,并将脱敏后的数据导出到脱敏后数据源。一般静态脱敏工具都支持文件到文件脱敏、文件到数据库脱敏、数据库到文件脱敏、原库脱敏、异库脱敏等脱敏方式。
静态脱敏
动态脱敏技术在工作时并不会对原数据进行改变,而是通过解析业务SQL语句匹配出脱敏规则对应的条件和数据。当匹配到对应的数据和条件时,通过对业务SQL语句进行改写,改写后的SQL语句在查询生产数据源输出后的数据即为脱敏后的数据。
动态脱敏
② 数据脱敏安全
相对来说,动态脱敏在自身数据安全性上是高于静态脱敏的。这是由于在脱敏作业中,动态脱敏不会涉及到对原数据的处理,动态脱敏改变的只是SQL语句。而静态脱敏则会对原数据进行处理,在处理过程中会存在比动态脱敏更多的风险点。
静态脱敏在数据安全保护上一个重点是首先要确认在脱敏系统中会不会落地。数据落地需要脱敏系统也具有数据源同样大小的存储空间,对脱敏系统的存储要求较高,同时进行多业务数据源脱敏的情况下,还需要对接存储系统,不仅硬件成本高,还存在安全风险。
数据脱敏从信息安全的职责分离的要求下出发,脱敏系统的管理者为安全管理员,将DBA接触敏感数据场景剥离出来,同时安全管理员不具有DBA权限也无法查看全部的敏感数据。但在数据落地的情况下,安全管理员可以从数据脱敏系统内获得全部敏感数据,这就违背了职责分离的初衷。
一般来说,使用ETL技术,或者针对不同数据库开发接口的静态脱敏系统都不会采用数据落地的方式。
③ 技术工具工作流程和目标
数据脱敏技术工具应能实现如下的目标:
敏感数据自动发现:数据脱敏系统在获取到数据源中的数据后,应能够利用特征匹配、机器学习等技术,自动发现数据源中的敏感数据。
不同场景脱敏规则:数据脱敏系统应当拥有丰富的脱敏规则,能够涵盖组织中的全部数据使用场景。
脱敏规则自动配置:针对自动发现的敏感数据,数据脱敏系统可以自动配置最合适的脱敏策略。
无损同构脱敏作业:数据脱敏系统在进行脱敏作业时,不能够对数据造成损坏、丢失,同时脱敏后的数据结构应与原数据一致。
脱敏全流程审计:对于脱敏全流程,从配置脱敏源、敏感数据自动发现、脱敏规则配置、脱敏作业发起、脱敏作业结束等,所有的操作都应该被审计记录。
美创科技对于数据处理阶段的数据脱敏过程域的实践指南就展开至此,《数据安全能力成熟度模型》实践指南系列持续更新中,欢迎持续关注。
图片新闻
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论