水印嵌入

针对数据库存储数据,提供了注入数据水印的能力。通过在数据字段中添加自定义水印编码信息,并且使用不同的嵌入算法保证了修改的隐蔽性、数据的可用性,实现了水印的嵌入过程。

可以将数据水印应用在泄露数据快速溯源、数据版权保护、规范外发流程等场景中。

水印特性说明如下:

进入数据水印嵌入页面的步骤如下:

  1. 在顶部导航栏中选择[数据运营/数据安全],进入数据安全模块面。

  1. 单击左侧导航树中的[数据脱敏/水印嵌入]菜单项,进入水印嵌入页面。

查看嵌入任务列表

在嵌入任务管理页面,通过列表的形式展示了创建的嵌入任务,支持根据任务名称、描述进行数据的过滤,列表中包含如下信息:

新建水印嵌入任务

·          执行水印嵌入的源数据表必须已注册为离线表。

·          当前仅支持MySQLPostgreSQLOracleHiveGreenplum、达梦和Vertica类型数据源中的表进行水印嵌入。

在水印嵌入页面中,单击列表左上方的<新建>按钮,进入创建水印溯源任务页面。

  1. 配置任务的名称和描述信息。

  1. 单击<下一步>按钮,进入源/目标配置页面。

  1. 配置源端参数,选择数据源类型、数据源及数据源中的数据表,参数说明见下表。

  1. 配置目标端参数,参数的说明请参见下表。

表-1 /目标配置参数

参数分类

参数名称

说明

源端配置

数据源类型

选择数据源类型

数据源

选择待水印嵌入处理的数据表所属的数据源

源表名

指定需要水印嵌入处理的数据表

目标端配置

导出类型

选择嵌入后数据导出的类型:

  • TABLE表示导出到数据表中,需要指定目标表的数据源、目标表、写入模式及抽取类型

  • HDFS表示导出到HDFS的文件中,需要指定HDFS目录、数据内容的分隔符及数据写入的模式

数据源

选择存储嵌入后数据的数据源。导出类型为TABLE时,需配置该参数

目标表是否存在

导出类型为TABLE时,需配置该参数

  • 选择“是”表示向已存在的表中存储数据,此时需确保目标表中对应源表嵌入字段的字段类型

  • 选择“否”表示根据配置的目标表名新建一张表存储数据,该新建的表中

目标表名

导出类型为TABLE时,需配置该参数

配置存储嵌入水印后数据的具体表名。如需放入已存在的表中,请确认此处指定的表名与实际的表名一致。

HDFS目录

选择嵌入水印后数据文件的保存路径。导出类型为HDFS时,需配置该参数

数据分隔符

指定嵌入水印数据写入文件时的字段分隔符。导出类型为HDFS时,需配置该参数

抽取类型

选择抽取源数据表中数据的类型,目标端导出类型为TABLE时,需配置该参数,支持全量和增量:

  • 全量:获取源表中全量数据,进行嵌入处理后写入目标表中

  • 增量:获取源表在上次水印嵌入操作后新增的数据,进行嵌入处理后写入目标表。如选择增量抽取,为实现增量识别,需指定增量字段,在启动任务时,系统会自动获取指定增量字段在目标表中的最大值,并以该值对应源表中的相同值作为起始位置,从源表中获取增量数据

增量字段

选取作为增量抽取依据的字段,仅支持选取数值、日期、时间戳类型的字段

抽取类型为增量时,需配置该参数

写入模式

选择水印嵌入后数据的写入方式:

  • 追加:导出类型为Table(导出到表)时,表示在表中原有数据后追加;导出类型为HDFS(导出到文件)时,表示在选择的目录中追加

  • 覆盖:导出类型为Table(导出到表)时,表示覆盖表中原有数据;导出类型为HDFS(导出到文件)时,表示清空目录后再写入

 

  1. 单击<下一步>按钮,进入水印策略配置页面。

  1. 配置水印信息,配置信息说明参考下表。

表-2 水印信息参数说明

参数名称

说明

水印嵌入字段

选择需要嵌入的字段,目前支持数值类型和字符类型的字段进行水印的嵌入

字段类型

显示选择嵌入字段的字段类型

水印策略

选择水印策略,目前支持如下两种水印策略

依赖主键列

  • 不依赖主键列

主键列

当选择依赖主键的水印策略时,需要选择主键列,默认填充当前源表的主键列,针对不存在主键的表,可以选择字符或者数值类型的列作为临时主键使用

水印算法

水印算法选择

  • 字符类型字段:零宽度空格算法

  • 数值类型字段:最低有效位修改算法

水印信息

需要嵌入的水印信息

 

  1. 单击<完成>按钮,操作完成。

编辑水印嵌入任务

在嵌入任务列表页面,点击任务名称后面<编辑>,可以进行任务的编辑。

水印嵌入任务修改后,在下次运行时会重新生成对应的业务流程

 

删除水印嵌入任务

在水印嵌入任务列表页面,点击任务名称后面<删除>,可以进行任务的删除。

如果对应的水印嵌入任务正在运行,那么不允许删除,删除水印任务会关联删除对应的业务流程信息。

 

执行水印嵌入任务

  1. 在水印嵌入任务列表页面,单击任务名称后的<执行>按钮,可以启动任务。

  1. 任务的启动过程会检查是否有生成对应的业务流程,如果没有会先生成对应的业务流程,可以通过点击任务后面的<执行逻辑>跳转查看生成的业务流程信息。