内置任务

内置任务是任务管理下内置的一些常用Java任务及监控任务。内置作业随数据开发服务部署而加载到服务中。可以方便用户快速的处理数据。各内置作业任务的说明如下表所示。

表-1 内置任务任务说明

任务名

任务描述

HBaseBulkLoad

该作业可以使用离线方式将数据原文件(HDFS文件)写入HBase

HiveStatistic

使用该作业统计Hive数据源的相关统计值

HBaseStatistic

使用该作业统计HBase数据源的相关统计值

STDB_EXPORT_DATALOAD

时空引擎批量导入导出

状态监控内置任务

可对DI同步作业的状态进行监控

 

表-2 STDB_EXPORT_DATALOAD作业任务参数说明

模式

参数

说明

值类型

示例

是否必填

模式1 (数据导入)

loadtype

任务类型

import

import

table

表名

数据源.表名

st_db.china_maps

converter

转换配置

HDFS上路径文件

/ste/ingest/china_csv.conf

files

文件

HDFS上路径文件

/ste/ingest/china_map.csv

模式2 (数据导出)

loadtype

任务类型

export

export

table

表名

数据源.表名

st_db.china_maps

cql

查询语句

CQL语句,参考STDB类型表查询页面

INCLUDE

attributes 

需要导出的属性列名称

列名称,输入多个时,以","隔开

adcode,name,level,geometry

oformat 

导出文件格式

csv\tsv\gml\json\avro\leaflet\orc\parquet\arrow

csv

output 

导出路径

HDFS上路径(该路径不为空时将会强制覆盖)

/ste/export/csv

sortby 

排序字段

属性名称

adcode

desc 

是否逆序

true\false

false

noheader 

是否保留文件头

true\false

false

name 

文件名称

文件名称

china_map