Impala库表管理

查看Impala数据库

  1. 在左侧导航树中选择[数据探索/库表管理],进入库表管理页面。

  1. 库表管理页面,单击Impala数据源类型名称,进入Impala库表管理页面。

  1. 库表管理页面:

查看Impala数据库中的表

  1. 在左侧导航树中选择[数据探索/库表管理],进入库表管理页面。

  1. 库表管理页面,单击Impala数据源类型名称,进入Impala库表管理页面。

  1. Impala库表管理页面,选择实例及数据库后,页面会显示对应数据库下的表。

  1. 单击表名称,进入表详情页面,页面会展示对应表的详细信息。

新建数据库

  1. 在左侧导航树中选择[数据探索/库表管理],进入库表管理页面。

  1. 库表管理页面,单击Impala数据源类型名称,进入Impala库表管理页面。

  1. Impala库表管理页面,在页面左侧数据库列表中单击<新建数据库>,弹出新建数据库窗口。

  1. 输入数据库名称及描述信息,单击<确定>按钮,即可完成数据库的新建。

导入数据

·         导入数据时会将配置的导入数据路径下(不包含子目录及其文件)所有符合导入数据类型的数据文件导入。

·         导入数据路径下不能包含不符合导入数据类型的数据文件,否则可能会导入失败。

 

  1. 在左侧导航树中选择[数据探索/库表管理],进入库表管理页面。

  1. 库表管理页面,单击Impala数据源类型名称,进入Impala库表管理页面。

  1. Impala库表管理页面,单击<导入数据>,弹出导入数据窗口。

  1. 输入相关配置信息,单击<确定>按钮,即可导入数据。

导入数据操作示例

1.      示例1:导入数据格式为文本文件

  1. 创建存储格式为TEXTFILE,列名为普通列idname(数据类型分别为INTSTRING)的表normal_table1

  1. 在当前连接实例所在集群HDFS新建导入数据路径/tmp/import/normal_table1,同时在该路径上传数据文件demo.txt,内容如下:

1,aaa

2,bbb

3,ccc

  1. /tmp/import/normal_table1路径及其文件赋予777权限。

  1. 单击击normal_table1对应操作栏<导入数据>按钮,弹出导入数据窗口。

  1. 导入数据类型选择文本文件,导入数据路径填写步骤b准备的数据文件路径:/tmp/import/normal_table1

  1. 自定义分隔符进行勾选,分隔符下拉框中选择“逗号(,)”(数据文件中字段值逗号分隔)。

  1. 单击<确定>按钮,完成导入数据后,可以执行查询语句:select id,name from normal_table1进行查看。

2.      示例2:导入数据格式为表

  1. 创建存储格式为TEXTFILE,列名包含普通列idname,分区列p1(数据类型分别为INTSTRINGSTRING)的表partition_table1

  1. 单击partition_table1对应操作栏<导入数据>按钮,弹出导入数据窗口。

  1. 动态分区不勾选,填写p1的分区值value1

  1. 导入数据类型选择“表”。

  1. 源表名填写示例1所建的表normal_table1,单击空白处等待加载字段信息。

  1. 在字段信息处勾选自定义,配置目的字段idname对应的源字段,分别为idname

  1. 单击<确定>按钮,完成导入数据后,可以执行查询语句:select id,name from partition_table1进行查看。

3.      示例3:导入数据格式为PARQUET

  1. 创建存储格式为PARQUET,列名为普通列idname(数据类型分别为INTSTRING)的表parquet_table1

  1. 在当前连接实例所在集群HDFS新建导入数据路径/tmp/import/parquet_table1,同时在该路径上传PARQUET数据文件(PARQUET数据文件可以经由parquet表导出数据获得),如:be4d7cfc36e1a258-b78522d00000001_1394119746_data.0.parq

  1. /tmp/import/parquet_table1路径及其文件赋予777权限。

  1. 单击parquet_table1对应操作栏<导入数据>按钮,弹出导入数据窗口。

  1. 导入数据类型选择“PARQUET”。

  1. 导入数据路径填写步骤b准备的数据文件路径/tmp/import/parquet_table1

  1. 单击<确定>按钮,完成导入数据后,可以执行查询语句:select id,name from parquet_table1进行查看。

4.      示例4:导入数据格式为ORC

  1. 创建存储格式为ORC,列名为普通列idname(数据类型分别为INTSTRING)的表orc_table1

  1. 在当前连接实例所在集群HDFS新建导入数据路径/tmp/import/orc_table1,同时在该路径上传ORC数据文件(ORC数据文件可以经由orc表导出数据获得)如:000000_0

  1. /tmp/import/orc_table1路径及其文件赋予777权限。

  1. 单击orc_table1对应操作栏<导入数据>按钮,弹出导入数据窗口。

  1. 导入数据类型选择“ORC”

  1. 导入数据路径填写步骤b准备的数据文件路径/tmp/import/orc_table1

  1. 单击<确定>按钮,完成导入数据后,可以执行查询语句:select id,name from orc_table1进行查看。

删除表

  1. 在左侧导航树中选择[数据探索/库表管理],进入库表管理页面。

  1. 库表管理页面,单击Impala数据源类型名称,进入Impala库表管理页面。

  1. Impala库表管理页面,支持表的单个删除或批量删除。

删除数据库

  1. 在左侧导航树中选择[数据探索/库表管理],进入库表管理页面。

  1. 库表管理页面,单击Impala数据源类型名称,进入Impala库表管理页面。

  1. Impala库表管理页面左侧展示Impala实例下包含的数据库。将鼠标放在数据库名称上,名称右侧出现按钮,单击该按钮即可删除该数据库。

缺省default数据库不可删除。

 

查询Impala数据库

  1. 在左侧导航树中选择[数据探索/库表管理],进入库表管理页面。

  1. 库表管理页面,单击Impala数据源类型名称,进入Impala库表管理页面。

  1. Impala库表管理页面,单击<查询>按钮,跳转到查询编辑页面,关于查询编辑页面的详情请参见查询编辑

清除数据

  1. 在左侧导航树中选择[数据探索/库表管理],进入库表管理页面。

  1. 库表管理页面,单击Impala数据源类型名称,进入Impala库表管理页面。

  1. Impala库表管理页面,单击<更多>按钮,在下拉框中选择“清除数据”,即可清空表里的所有数据。

复制表结构

  1. 在左侧导航树中选择[数据探索/库表管理],进入库表管理页面。

  1. 库表管理页面,单击Impala数据源类型名称,进入Impala库表管理页面。

  1. Impala库表管理页面,单击<更多>按钮,在下拉框中选择“复制表结构”,弹出复制表结构窗口。

  1. 输入目的数据库、目的表名

  1. 单击<确定>按钮,会基于当前表在目标数据库创建一个表结构一样的目标表。