时空表聚合统计是使用CQL条件进行过滤,然后选择对应的聚合函数对结果数据进行统计分析,支持分组统计。统计的结果数据只包含统计结果,不包含原始数据,结果展示使用图表形式呈现。分组统计使用表格形式呈现结果。
操作步骤如下:
点击时空查询表列表的时空表,点击聚合统计标签进入聚合统计页面。
在时空表名下拉列表中选择对应需要统计的表。
在CQL中输入CQL查询语句(默认为INCLUDE,即全表查询)。
在聚合统计中分别填入:属性别名,下拉选择统计函数,按照格式填写参数,点击√确认当前栏,如需要统计多个,点击+添加一行重复操作。
点击统计,等待结果。
表-1 统计分析
类型 |
说明 |
表达式 |
图形 |
count |
数量 |
Count() |
柱图 |
min/max |
最小值/最大值 |
MinMax(field) |
柱图 |
enumeration |
枚举 |
Enumeration(field) |
柱图 |
top-k |
Top-k |
TopK(field) |
柱图, 堆叠 |
histogram |
直方图 |
Histogram(field,number,min,max) |
柱图 |
descriptivestats |
描述性统计 |
DescriptiveStats(...attrs) |
表格 |
GroupBy |
统计数据 |
GroupBy(field, function(..args)) |
柱图 |
可以使用GroupBy根据分组值计算统计数据。
例如,GroupBy ("foo", MinMax("bar"))。
Z3频率和直方图是特殊的统计数据,它们将对几何图形和日期创建的Z3值进行操作。
<time period>为:day、week、month,或year。
<precision>为:
对于几何和Z3类型,表示z索引要保留的位的数量(最大值为64),且前2位不包含任何信息。
对于日期类型,表示为分组的毫秒数。
对于数字类型,表示将组合在一起的数字的数量。
对于浮点类型,表示小数点位数。
对于字符串类型,表示字符的数量。
对于histogram统计:
<bins>:直方图分为多少组。
<min>/<max>:直方图各组的初始大小,但不是绝对限制,如果需要,直方图会随着新值的添加而扩展,但是可能会丢失一些精度。注意min必须小于max。
对于DescriptiveStats(描述性)统计:属性只能为数字类型(Int、Double、Long、Float)。
表-2 参数说明
参数 |
取值类型 |
说明 |
解释 |
count |
Long |
统计结果数 |
DescriptiveStats(...fields)参数为可变数字。统计结果各个属性除去count均为数组,数组中统计结果顺序同参数顺序。 |
minimum |
Double |
最小值 |
|
maximum |
Double |
最大值 |
|
mean |
Double |
平均值 |
|
population_variance |
Double |
总体方差 |
|
population_standard_deviation |
Double |
总体标准差 |
|
population_skewness |
Double |
总体偏度 |
|
population_kurtosis |
Double |
总体峭度 |
|
population_excess_kurtosis |
Double |
总体过度峰度 |
|
sample_variance |
Double |
样本方差 |
|
sample_standard_deviation |
Double |
样本标准差 |
|
sample_skewness |
Double |
样本偏度 |
|
sample_kurtosis |
Double |
样本峰度 |
|
sample_excess_kurtosis |
Double |
样本过度峰度 |
|
population_covariance |
Double |
总体协方差 |
|
population_correlation |
Double |
总体相关度 |
|
sample_covariance |
Double |
样本协方差 |
|
sample_correlation |
Double |
样本相关度 |