在[授权管理]的数据源授权功能中,对数据源配置扫描权限后,系统会自动生成该数据源对应的扫描任务。这些扫描任务可以在扫描任务功能中统一调度管理。
· 若需要删除扫描任务,请在[授权管理]的数据源授权功能中取消对应数据源的扫描权限。 · 启动扫描任务后,系统将使用所有启用的数据识别规则,识别对应数据源中包含敏感数据的表和字段(列)。 |
进入扫描任务管理页面的步骤如下:
在顶部导航栏中选择[数据运营/数据安全],进入数据安全模块。
单击左侧导航树中的[数据识别/识别任务]菜单项,进入数据识别任务管理页面。
页面中以列表的形式展示了数据识别扫描任务的信息:
数据源名:扫描任务的数据源对象名称。
数据源类型:数据源的类型。
自动扫描:是否开启自动扫描。开启后,可以自动运行扫描任务,并按照配置的调度周期;关闭后,则不再按照调度配置自动定时运行扫描任务,只能手动启动扫描任务。
扫描状态:扫描任务的当前状态,包括准备中、运行中、结束、跳过执行等。
扫描开始时间:扫描任务开始运行的时间。
扫描结束时间:扫描任务运行完成的时间。
操作:提供了扫描任务的启动、配置及日志查看功能。
列表右上方提供了扫描任务的查询功能。查询条件包括:数据源类型、数据源名。配置查询条件后,单击后方的图标,即可查询符合条件的任务。单击
图标,可以清除当前查询。
系统支持手动启动各扫描任务,可以启动单个任务或批量启动任务。
启动单个任务:在扫描任务管理页面的列表中,单击待启动任务对应操作列的<立即扫描>按钮,系统会启动对应的扫描任务。
批量启动任务:在扫描任务管理页面中,单击列表上方的<一键启动>按钮,并在弹出窗口中单击<确定>按钮,系统会启动所有的扫描任务。
系统支持手动停止正在运行中的扫描任务,可以停止单个任务或批量停止任务。
停止单个任务:在扫描任务管理页面的列表中,单击待停止任务对应操作列的<立即停止>按钮,系统会停止对应的扫描任务。
批量停止任务:在扫描任务管理页面中,单击列表上方的<一键停止>按钮,并在弹出窗口中单击<确定>按钮,系统会停止所有的扫描任务。
系统支持对扫描任务配置运行参数和调度周期,使扫描任务可以按运行参数和调度周期配置执行。配置调度周期后,系统会周期性启动扫描任务,根据数据识别规则对已授权数据源中所有的表启动扫描任务,标识敏感字段。
在扫描任务列表中,单击操作列的<配置>按钮,页面右侧弹出配置窗口。
配置扫描参数,各参数说明如下表所示。
表-1 扫描配置参数说明
参数名称 |
说明 |
取值 |
扫描条数下限 |
该参数定义了参与匹配的数据的最少条数,若某字段中的数据去除空值后小于该参数值,则在扫描过程直接跳过该字段 该参数配置较大时,参与匹配的数据量较多,识别速度稍慢,但是识别的准确度会提高;该参数配置较小,则相反。请根据项目需求合理配置该值 |
整数,范围为10~10000 |
匹配阈值 |
参数定义了扫描过程中成功匹配的阈值,若某字段(即表中的某列)中,与规则匹配成功的数据条数占参与匹配数据总数的比例超过该阈值,则可认为该字段属于该敏感类型,并记录到敏感信息维护列表中 匹配阈值越大,匹配结果越精确,但是会因为异常数据等原因,导致敏感数据不能被全部识别。请根据项目需求合理配置该值 |
整数,范围为1~100 |
扫描重试次数 |
该参数用于控制在数据扫描过程中出现失败,系统自动重新扫描的最大次数。配置后系统会运行扫描任务直至成功或达到最大重试次数 |
整数,范围为0~5 |
增量扫描 |
指定对数据源扫描的范围,开启表示仅扫描增量数据;关闭表示扫描全量数据。该参数默认为关闭,对于首次对某数据源扫描时,建议保持关闭;对于非首次扫描,可以开启 |
- |
配置调度参数,选择“开启”可配置调度参数,选择“关闭”则不需要配置调度参数。各参数说明如下表所示。
表-2 调度配置参数说明
参数名称 |
说明 |
取值 |
调度方式 |
对于扫描任务的调度,支持简单调度和高级调度:
|
枚举值,包括简单调度和高级调度 |
有效时间 |
配置调度配置生效的时间段,在时间控件弹窗中,指定开始日期和时间点,以及结束日期和时间点 |
- |
调度周期(简单调度) |
对于简单调度,可以直接设置天数、小时数和分钟数指定调度周期,扫描任务会按照配置的调度周期,即在有效时间范围内每隔X天X小时X分钟运行一次 |
天数的范围为0~366;小时数的范围为0~23;分钟数的范围为0~59 |
表达式生成器(高级调度) |
高级调度通过Cron表达式来控制调度周期,表达式可以更灵活地配置扫描任务的运行周期。为使Cron表达式的配置更直观,系统提供了表达式生成器,且在配置完表达式后,还支持预览根据表达式周期计算出的最近10次运行时间 |
- |
Cron表达式是一个字符串,该字符串由4个空格分为4种时间值和1个占位符(?),每一个时间值代表一个时间含义。Cron表达式的格式如下: [分] [时] [天] [月] ? 表达式生成器支持分别指定分钟、小时、天/周、月规则,系统会自动生成对应的Cron表达式。 “最近10次运行时间”展示了按照Cron表达式表示的周期计算得出的任务最近10次运行时间。 |
扫描任务管理页面还提供了查看日志的功能。
单击<查看日志>按钮,可以跳转至识别日志页面,在调度日志中会展示数据源扫描任务对应的全量调度日志,详细说明请参见调度日志。