系统配置

系统配置页面展示了数据脱敏支持配置的系统参数,通过合理配置参数值,能够平衡数据扫描速度与识别准确度之间的平衡。该页面也可以配置定时扫描相关参数,提升扫描灵活性。

·          系统管理员可以在页面右上角的组织名称下拉菜单中选择不同的组织,查看并配置不同组织下的系统参数。

·          普通组织的管理员可以查看并配置所属组织下的系统参数。

 

进入系统配置页面的方法如下:

  1. 在顶部导航栏中选择[数据运营平台],进入数据运营平台页面。

  1. 单击左侧导航树中的[数据脱敏]菜单项,进入数据脱敏。

  1. 单击左侧二级导航树中的[系统配置]菜单项,进入系统配置页面。

页面中通过列表的形式展示了系统参数信息,包括参数名、参数取值、参数修改时间,并在操作列提供了编辑参数的链接。

配置扫描条数下限

对于扫描方式配置为内容扫描的数据识别规则,在通过数据扫描识别表字段所属的敏感类型时,需要将表中的数据与数据识别规则进行匹配操作。

扫描条数下限定义了参与匹配的数据的最少条数,若某字段中的数据去除空值后小于该参数值,则在扫描过程直接跳过该字段。

配置该参数的步骤如下:

  1. 在系统配置页面中,单击“扫描条数下限”参数对应操作列中的“编辑”链接,弹出的修改配置窗口。

  1. 修改参数值。扫描条数下限的取值范围为101000,包含上下限。

  1. 单击<确定>按钮,参数配置完成。

该参数配置较小,参与匹配的数据量少,识别速度快,但是会降低识别准确度;该参数配置较大,情况完全相反。用户可以根据项目需求合理配置该值。

 

配置匹配阈值

对于扫描方式配置为内容扫描的数据识别规则,在通过数据扫描识别表字段所属的敏感类型时,需要将表中的数据与数据识别规则进行匹配操作。

匹配阈值参数定义了扫描过程中成功匹配的阈值,若某字段(即表中的某列)中,与规则匹配成功的数据条数占参与匹配数据总数的比例超过该阈值,则可认为该字段属于该敏感类型,并记录到敏感信息维护列表中。

配置该参数的步骤如下:

  1. 在系统配置页面中,单击“匹配阈值”参数对应操作列中的“编辑”链接,弹出的修改配置窗口。

  1. 修改参数值。匹配阈值的取值范围为0.11,包含上下限。

  1. 单击<确定>按钮,参数配置完成。

匹配阈值越大,匹配结果越精确,但是会因为异常数据等原因,导致敏感数据不能被识别。用户可以根据项目需求合理配置该值。

 

配置扫描重试次数

若数据扫描过程中出现失败,系统会自动重试当前操作,直至成功或达到最大重试次数。该参数用于配置扫描的最大重试次数。

配置该参数的步骤如下:

  1. 在系统配置页面中,单击“扫描重试次数”参数对应操作列中的“编辑”链接,弹出的修改配置窗口。

  1. 修改参数值。扫描重试次数的取值范围为15,包含上下限。

  1. 单击<确定>按钮,参数配置完成。

配置启动定时扫描

系统支持定时扫描功能,用户可根据自身需求启用或禁用定时扫描功能。启动定时扫描后,可以周期性启动扫描任务,用所有数据识别规则对上个扫描周期后新建的表启动扫描任务,标识敏感字段。

配置该参数的步骤如下:

  1. 在系统配置页面中,单击“启用定时扫描”参数对应操作列中的“编辑”链接,弹出的修改配置窗口。

  1. 选择是否启用定时扫描功能。

  1. 单击<确定>按钮,参数配置完成。

配置定时扫描调度时间

定时扫描使用了功能强大的cron表达式来定义定时任务的执行策略。

配置该参数的步骤如下:

  1. 在系统配置页面中,单击“定时扫描调度时间”参数对应操作列中的“编辑”链接,弹出的修改配置窗口。

  1. 配置参数值,可以选择以下两种方式之一:

  1. 单击<确定>按钮,参数配置完成。

cron 表达式是一个字符串,该字符串由 6 个空格分为 7 个值,每一个值代表一个时间含义。格式如下:

 [] [] [] [] [] [] []

通常定义的部分可以省略,所以实际常用的配置由前六个值组成。“天”和“周”两个值仅能设置一个,另一个以“?”占位。

“未来5次运行时间”展示了配置的cron表达式后接下来5次的调度时刻。