Sqoop任务

·          对数据库的支持。支持DB2、达梦、GreenPlumHBaseHBase PhoenixMySQLPostgreSQLMPPOracleSQL ServerTeraDataGeneric JDBCHANA等数据源。

·          Sqoop任务共支持5种任务类型,分别为:数据库到HDFS、数据库到HBase、数据库到HiveHDFS到数据库、Hive到数据库。每种任务类型都可以进行整表导出,同时支持通过参数配置选择部分字段导出。

·          操作数据库时需要将被操作的数据库驱动手动放入Sqoop安装路径下。若使用DataEngine平台,则放置驱动的目录为/usr/hdp/3.0.1.0-187/sqoop/lib/

·          从大数据集群(HDFS/Hive/HBase等)导出数据到Oracle数据库时,不支持表名小写的情况。

·          Sqoop命令是自动生成的建议命令,如果运行失败,请结合日志信息调试后重新尝试。

 

该功能用于新增Sqoop任务。

  1. 在数据集成模块下选择[任务管理/任务列表],进入任务列表页面。

  1. 单击任务列表左上角的<新增>按钮,弹出新增任务窗口。

  1. 新增任务窗口,选择任务类型为“Sqoop任务”,单击<跳转任务设计页面>可跳转至任务设计页面,用户可根据实际需要进行任务设计。