聚合统计功能通过CQL条件语句查询特定的数据,然后选择对应的聚合函数对查询结果数据进行统计分析,支持分组统计。统计的结果数据只包含统计结果,不包含原始数据,结果展示使用图表形式呈现。分组统计使用表格形式呈现结果。
聚合统计的步骤如下:
在时空查询页面左侧选择目标时空数据源。
在页面右侧的聚合统计页签中,配置各项参数。
在时空表名参数的下拉列表中选择对应需要统计的表。
在CQL中输入CQL查询语句(默认为INCLUDE,即全表查询)。
单击<统计>按钮,等待聚合统计处理结果。
表-1 统计分析函数
|
类型 |
说明 |
表达式 |
图形 |
|
Histogram |
直方图 |
Histogram(field,number,min,max) |
柱图 |
|
TopK |
Top-k |
TopK(field) |
柱图,堆叠 |
|
Count |
数量 |
Count() |
柱图 |
|
Min/Max |
最小值/最大值 |
MinMax(field) |
柱图 |
|
Enumeration |
枚举 |
Enumeration(field) |
柱图 |
|
Descriptivestats |
描述性统计 |
DescriptiveStats(...attrs) |
表格 |
|
GroupBy |
统计数据 |
GroupBy(field, function(..args)) |
柱图 |
可以使用GroupBy根据分组值计算统计数据。
例如,GroupBy ("foo", MinMax("bar"))。
Z3频率和直方图是特殊的统计数据,它们将对几何图形和日期创建的Z3值进行操作。
<time period>为:day、week、month,或year。
<precision>为:
对于几何和Z3类型,表示z索引要保留的位的数量(最大值为64),且前2位不包含任何信息。
对于日期类型,表示为分组的毫秒数。
对于数字类型,表示将组合在一起的数字的数量。
对于浮点类型,表示小数点位数。
对于字符串类型,表示字符的数量。
对于Histogram统计:
<bins>:直方图分为多少组。
<min>/<max>:直方图各组的初始大小,但不是绝对限制,如果需要,直方图会随着新值的添加而扩展,但是可能会丢失一些精度。注意min必须小于max。
对于DescriptiveStats(描述性)统计:属性只能为数字类型(Int、Double、Long、Float)。
表-2 参数说明
|
参数 |
取值类型 |
说明 |
解释 |
|
count |
Long |
统计结果数 |
DescriptiveStats(...attrs)参数为可变数字。统计结果各个属性除去count均为数组,数组中统计结果顺序同参数顺序 |
|
minimum |
Double |
最小值 |
|
|
maximum |
Double |
最大值 |
|
|
mean |
Double |
平均值 |
|
|
population_variance |
Double |
总体方差 |
|
|
population_standard_deviation |
Double |
总体标准差 |
|
|
population_skewness |
Double |
总体偏度 |
|
|
population_kurtosis |
Double |
总体峭度 |
|
|
population_excess_kurtosis |
Double |
总体过度峰度 |
|
|
sample_variance |
Double |
样本方差 |
|
|
sample_standard_deviation |
Double |
样本标准差 |
|
|
sample_skewness |
Double |
样本偏度 |
|
|
sample_kurtosis |
Double |
样本峰度 |
|
|
sample_excess_kurtosis |
Double |
样本过度峰度 |
|
|
population_covariance |
Double |
总体协方差 |
|
|
population_correlation |
Double |
总体相关度 |
|
|
sample_covariance |
Double |
样本协方差 |
|
|
sample_correlation |
Double |
样本相关度 |