针对数据库存储数据,提供了注入数据水印的能力。通过在数据字段中添加自定义水印编码信息,并且使用不同的嵌入算法保证了修改的隐蔽性、数据的可用性,实现了水印的嵌入过程。
可以将数据水印应用在泄露数据快速溯源、数据版权保护、规范外发流程等场景中。
水印特性说明如下:
水印容量:支持大容量的水印信息嵌入。
鲁棒性: 水印数据可以抵抗一定的恶意水印攻击方式。
隐蔽性:嵌入水印后,不会导致数据出现明显的变化,修改不易察觉,不影响数据的使用性。
盲检测: 当前的水印嵌入方式保证了水印溯源过程不依赖于原始的数据信息。
进入数据水印嵌入页面的步骤如下:
在顶部导航栏中选择[数据运营/数据安全],进入数据安全模块面。
单击左侧导航树中的[数据脱敏/水印嵌入]菜单项,进入水印嵌入页面。
在嵌入任务管理页面,通过列表的形式展示了创建的嵌入任务,支持根据任务名称、描述进行数据的过滤,列表中包含如下信息:
任务名称:水印嵌入任务名称
描述:任务的描述信息。
创建人: 创建任务用户。
源端数据源:嵌入数据所在的数据源。
源表名:嵌入数据所在表。
嵌入列:嵌入的字段列,当前只支持单字段的水印嵌入。
状态:任务的运行状态。
修改时间:任务的最近一次的修改时间。
操作:支持的操作类型包括执行、编辑、删除、执行逻辑。
· 执行水印嵌入的源数据表必须已注册为离线表。 · 当前仅支持MySQL、PostgreSQL、Oracle、Hive、Greenplum、达梦和Vertica类型数据源中的表进行水印嵌入。 |
在水印嵌入页面中,单击列表左上方的<新建>按钮,进入创建水印溯源任务页面。
配置任务的名称和描述信息。
单击<下一步>按钮,进入源/目标配置页面。
配置源端参数,选择数据源类型、数据源及数据源中的数据表,参数说明见下表。
配置目标端参数,参数的说明请参见下表。
表-1 源/目标配置参数
参数分类 |
参数名称 |
说明 |
源端配置 |
数据源类型 |
选择数据源类型 |
数据源 |
选择待水印嵌入处理的数据表所属的数据源 |
|
源表名 |
指定需要水印嵌入处理的数据表 |
|
目标端配置 |
导出类型 |
选择嵌入后数据导出的类型:
|
数据源 |
选择存储嵌入后数据的数据源。导出类型为TABLE时,需配置该参数 |
|
目标表是否存在 |
导出类型为TABLE时,需配置该参数
|
|
目标表名 |
导出类型为TABLE时,需配置该参数 配置存储嵌入水印后数据的具体表名。如需放入已存在的表中,请确认此处指定的表名与实际的表名一致。 |
|
HDFS目录 |
选择嵌入水印后数据文件的保存路径。导出类型为HDFS时,需配置该参数 |
|
数据分隔符 |
指定嵌入水印数据写入文件时的字段分隔符。导出类型为HDFS时,需配置该参数 |
|
抽取类型 |
选择抽取源数据表中数据的类型,目标端导出类型为TABLE时,需配置该参数,支持全量和增量:
|
|
增量字段 |
选取作为增量抽取依据的字段,仅支持选取数值、日期、时间戳类型的字段 抽取类型为增量时,需配置该参数 |
|
写入模式 |
选择水印嵌入后数据的写入方式:
|
单击<下一步>按钮,进入水印策略配置页面。
配置水印信息,配置信息说明参考下表。
表-2 水印信息参数说明
参数名称 |
说明 |
水印嵌入字段 |
选择需要嵌入的字段,目前支持数值类型和字符类型的字段进行水印的嵌入 |
字段类型 |
显示选择嵌入字段的字段类型 |
水印策略 |
选择水印策略,目前支持如下两种水印策略 依赖主键列
|
主键列 |
当选择依赖主键的水印策略时,需要选择主键列,默认填充当前源表的主键列,针对不存在主键的表,可以选择字符或者数值类型的列作为临时主键使用 |
水印算法 |
水印算法选择
|
水印信息 |
需要嵌入的水印信息 |
单击<完成>按钮,操作完成。
在嵌入任务列表页面,点击任务名称后面<编辑>,可以进行任务的编辑。
水印嵌入任务修改后,在下次运行时会重新生成对应的业务流程 |
在水印嵌入任务列表页面,点击任务名称后面<删除>,可以进行任务的删除。
如果对应的水印嵌入任务正在运行,那么不允许删除,删除水印任务会关联删除对应的业务流程信息。 |
在水印嵌入任务列表页面,单击任务名称后的<执行>按钮,可以启动任务。
任务的启动过程会检查是否有生成对应的业务流程,如果没有会先生成对应的业务流程,可以通过点击任务后面的<执行逻辑>跳转查看生成的业务流程信息。