管理识别任务

[授权管理]的数据源授权功能中,对数据源配置扫描权限后,系统会自动生成该数据源对应的扫描任务。这些扫描任务可以在扫描任务功能中统一调度管理。

·          若需要删除扫描任务,请在[授权管理]的数据源授权功能中取消对应数据源的扫描权限。

·          启动扫描任务后,系统将使用所有启用的数据识别规则,识别对应数据源中包含敏感数据的表和字段(列)。

 

进入扫描任务管理页面的步骤如下:

  1. 在顶部导航栏中选择[数据运营/数据安全],进入数据安全模块。

  1. 单击左侧导航树中的[数据识别/识别任务]菜单项,进入数据识别任务管理页面。

页面中以列表的形式展示了数据识别扫描任务的信息:

列表右上方提供了扫描任务的查询功能。查询条件包括:数据源类型、数据源名。配置查询条件后,单击后方的图标,即可查询符合条件的任务。单击图标,可以清除当前查询。

启动扫描任务

系统支持手动启动各扫描任务,可以启动单个任务或批量启动任务。

停止扫描任务

系统支持手动停止正在运行中的扫描任务,可以停止单个任务或批量停止任务。

编辑扫描任务运行配置

系统支持对扫描任务配置运行参数和调度周期,使扫描任务可以按运行参数和调度周期配置执行。配置调度周期后,系统会周期性启动扫描任务,根据数据识别规则对已授权数据源中所有的表启动扫描任务,标识敏感字段。

  1. 在扫描任务列表中,单击操作列的<配置>按钮,页面右侧弹出配置窗口。

  1. 配置扫描参数,各参数说明如下表所示。

表-1 扫描配置参数说明

参数名称

说明

取值

扫描条数下限

该参数定义了参与匹配的数据的最少条数,若某字段中的数据去除空值后小于该参数值,则在扫描过程直接跳过该字段

该参数配置较大时,参与匹配的数据量较多,识别速度稍慢,但是识别的准确度会提高;该参数配置较小,则相反。请根据项目需求合理配置该值

整数,范围为1010000

匹配阈值

参数定义了扫描过程中成功匹配的阈值,若某字段(即表中的某列)中,与规则匹配成功的数据条数占参与匹配数据总数的比例超过该阈值,则可认为该字段属于该敏感类型,并记录到敏感信息维护列表中

匹配阈值越大,匹配结果越精确,但是会因为异常数据等原因,导致敏感数据不能被全部识别。请根据项目需求合理配置该值

整数,范围为1100

扫描重试次数

该参数用于控制在数据扫描过程中出现失败,系统自动重新扫描的最大次数。配置后系统会运行扫描任务直至成功或达到最大重试次数

整数,范围为05

增量扫描

指定对数据源扫描的范围,开启表示仅扫描增量数据;关闭表示扫描全量数据。该参数默认为关闭,对于首次对某数据源扫描时,建议保持关闭;对于非首次扫描,可以开启

-

 

  1. 配置调度参数,选择“开启”可配置调度参数,选择“关闭”则不需要配置调度参数。各参数说明如下表所示。

表-2 调度配置参数说明

参数名称

说明

取值

调度方式

对于扫描任务的调度,支持简单调度和高级调度:

  • 简单调度:简单地通过天/小时/分钟配置调度周期

  • 高级调度:通过Cron表达式配置调度周期

枚举值,包括简单调度和高级调度

有效时间

配置调度配置生效的时间段,在时间控件弹窗中,指定开始日期和时间点,以及结束日期和时间点

-

调度周期(简单调度)

对于简单调度,可以直接设置天数、小时数和分钟数指定调度周期,扫描任务会按照配置的调度周期,即在有效时间范围内每隔XX小时X分钟运行一次

天数的范围为0366;小时数的范围为023;分钟数的范围为059

表达式生成器(高级调度)

高级调度通过Cron表达式来控制调度周期,表达式可以更灵活地配置扫描任务的运行周期。为使Cron表达式的配置更直观,系统提供了表达式生成器,且在配置完表达式后,还支持预览根据表达式周期计算出的最近10次运行时间

-

 

Cron表达式是一个字符串,该字符串由4个空格分为4种时间值和1个占位符(?),每一个时间值代表一个时间含义。Cron表达式的格式如下:

[] [] [] [] ?

表达式生成器支持分别指定分钟、小时、天/周、月规则,系统会自动生成对应的Cron表达式。

“最近10次运行时间”展示了按照Cron表达式表示的周期计算得出的任务最近10次运行时间。

 

查看日志

扫描任务管理页面还提供了查看日志的功能。

单击<查看日志>按钮,可以跳转至识别日志页面,在调度日志中会展示数据源扫描任务对应的全量调度日志,详细说明请参见调度日志