正则表达式组件可以将输入字段的字符串值与正则表达式定义的文本模式匹配,将匹配结果存入新的字段中可以为后续连接的组件使用。
双击画布中的正则表达式组件,弹出正则表达式窗口。
输入步骤名称,名称要求为非空,2到50个字符。
分别配置设置、内容两个页签下的相关参数项。
单击<确定>按钮完成配置。
在设置页签下,需启用“为每个捕获组创建一个字段”选项后,方可启用“替换之前的字段”选项。
在内容页签下,启用正规分解匹配时,需要确保数据只包含ASCII字符;启用Unicode忽略大小写时,需要确保数据只包含US ASCII字符。
要匹配的字段:必填项,要进行正则表达式匹配的字段名称,来自上一个步骤。
结果字段名称:必填项,输出字段的名称(布尔值),该字段将被添加到输出流,字段输出值将指示输入字段的值是否与正则表达式匹配,Y表示匹配,N表示不匹配。
为每个捕获组创建一个字段:启用时,可以根据正则表达式中的捕获组创建新字段,将提取与正则表达式中的捕获组对应的输入字段值的子字符串并将其存储在新的输出字段中。捕获组是正则表达式中被包围在一对左右括号中的部分,需要在“捕获组字段”为每个捕获组定义一个字段。
替换之前的字段:启用时,为捕获组创建的字段将替换相同名称的输入流中的现有字段。如果未启用,将为每个捕获组字段的输出流添加新字段。
正则表达式:要匹配的字段与这里的正则表达式匹配。
正规分解匹配:检查数据时,忽略Unicode编码的差异。
忽略大小写:不区分大小写的匹配。
在表达式中允许有空格和注释:启用时,该步骤将忽略从#行开始的空格和嵌入式注释。在此模式下,必须使用\s令牌来匹配空格,如果未启用此选项,则正则表达式中出现的任何空白字符将按原样匹配。
点字符(.)全部匹配模式:启用时,表达式“.”匹配任何字符,包括行终止符。默认情况下,此表达式匹配除行终止符之外的任何字符。
启用多行模式:启用时,“^” 匹配每一个行起始符或输入序列的开头,“$”匹配每一个行终止符或输入序列的结尾。默认,这些表达式仅在整个输入序列的开头和结尾相匹配。
Unicode忽略大小写:启用时,检查并忽略差异。
Unix行模式:启用时,只能在“.”,“^”和“$”的行为中识别行终止符。
操作:用于删除此行数据。
新字段:自定义的新字段。
类型:包括字符串、数值、日期、布尔、整型、二进制、时间戳、高精度类、网址。
格式:对指定类型(如日期、时间、精度数值)进行格式化转化。
长度:输出字段内容的长度。
Number类型:有效数的数量。
String类型:字符串的长度。
精度:输出字段内容的精度。
Number类型:浮点数的数量。
String、Date、Boolean类型:未使用。
分组符号:指定分组符号,分组可以是“.”或“,”。
十进制:指定十进制格式,小数点可以是“,”或“.”。
货币:用来解释如$10,000.00的数字。
如果……则空置:如果字段内容是……则该处空置,“……”为需填入的内容。
默认值:如果该字段为空时,则输入默认值。