HDFS抽取

HDFS抽取组件可对HDFS文件系统中结构化的数据进行抽取。

操作步骤

  1. 双击画布中的HDFS抽取组件,弹出从HDFS文件抽取窗口。

  1. 输入步骤名称,名称要求为非空,250个字符。

  1. 选择HDFS数据库连接,分别配置文件、内容和字段页签下的相关参数项。

  1. 单击<确定>按钮完成配置。

注意事项

参数说明

1.      文件页签:确定从哪个文件抽取数据

2.      内容页签:设置处理文件格式与内容

3.      错误处理页签:对读取数据过程中的错误处理进行参数配置

4.      过滤页签:过滤器选项卡使您能够在文本文件中指定要跳过的行

5.      字段页签:用于指定从文本文件中读取的字段名称或格式等信息