内置任务是任务管理下内置的一些常用Java任务及监控任务。内置作业随数据开发服务部署而加载到服务中。可以方便用户快速的处理数据。各内置作业任务的说明如下表所示。
表-1 内置任务任务说明
任务名 |
任务描述 |
HBaseBulkLoad |
该作业可以使用离线方式将数据原文件(HDFS文件)写入HBase |
HiveStatistic |
使用该作业统计Hive数据源的相关统计值 |
HBaseStatistic |
使用该作业统计HBase数据源的相关统计值 |
STDB_EXPORT_DATALOAD |
时空引擎批量导入导出 |
状态监控内置任务 |
可对DI同步作业的状态进行监控 |
表-2 STDB_EXPORT_DATALOAD作业任务参数说明
模式 |
参数 |
说明 |
值类型 |
示例 |
是否必填 |
模式1 (数据导入) |
loadtype |
任务类型 |
import |
import |
是 |
table |
表名 |
数据源.表名 |
st_db.china_maps |
是 |
|
converter |
转换配置 |
HDFS上路径文件 |
/ste/ingest/china_csv.conf |
是 |
|
files |
文件 |
HDFS上路径文件 |
/ste/ingest/china_map.csv |
是 |
|
模式2 (数据导出) |
loadtype |
任务类型 |
export |
export |
是 |
table |
表名 |
数据源.表名 |
st_db.china_maps |
是 |
|
cql |
查询语句 |
CQL语句,参考STDB类型表查询页面 |
INCLUDE |
是 |
|
attributes |
需要导出的属性列名称 |
列名称,输入多个时,以","隔开 |
adcode,name,level,geometry |
是 |
|
oformat |
导出文件格式 |
csv\tsv\gml\json\avro\leaflet\orc\parquet\arrow |
csv |
是 |
|
output |
导出路径 |
HDFS上路径(该路径不为空时将会强制覆盖) |
/ste/export/csv |
是 |
|
sortby |
排序字段 |
属性名称 |
adcode |
是 |
|
desc |
是否逆序 |
true\false |
false |
是 |
|
noheader |
是否保留文件头 |
true\false |
false |
是 |
|
name |
文件名称 |
文件名称 |
china_map |
是 |