在大数据集群中,仅部分组件的部分进程支持添加操作,详情请以实际页面为准。 |
集群在使用过程中,根据实际需要,可执行添加进程的操作。
在集群管理的左侧导航树中选择[集群列表],进入集群列表页面。
在集群列表页面,单击某集群名称可跳转至对应的集群详情页面。
在集群详情页面选择[组件]页签,单击组件列表中某组件名进入组件详情页面,在右上角组件操作的下拉框中选择<添加进程>按钮,弹出添加进程窗口。
选择进程及主机:在选择进程项的下拉列表中选择可添加的组件进程,在选择主机项的主机列表中勾选进程安装在哪一个主机上(支持多选)。
部署进程:选择结束后单击下一步部署进程,直至部署进度条结束(不支持中止)。
启动进程:部署进程结束后单击下一步启动进程,直至启动进度条结束(不支持中止)。
所有步骤执行完成后,在对应主机上即可完成进程的安装。
在大数据集群中,仅部分组件的部分进程支持启动操作,详情请以实际页面为准。 |
集群在使用过程中,根据实际需要,可执行启动进程的操作。
在集群管理的左侧导航树中选择[集群列表],进入集群列表页面。
在集群列表页面,单击某集群名称可跳转至对应的集群详情页面。
在集群详情页面选择[组件]页签,单击组件列表中某组件名可跳转至对应的组件详情页面。
在组件详情页面选择[部署拓扑]页签,单击进程列表中某进程对应的<开启>按钮并在弹窗中进行确定后,即可启动该进程。
· 在大数据集群中,仅部分组件的部分进程支持停止操作,详情请以实际页面为准。 · 执行停止进程操作之后,将中止该进程及与其有依赖关系的其他组件上的业务访问。 |
集群在使用过程中,根据实际需要,可执行停止进程的操作。
在集群管理的左侧导航树中选择[集群列表],进入集群列表页面。
在集群列表页面,单击某集群名称可跳转至对应的集群详情页面。
在集群详情页面选择[组件]页签,单击组件列表中某组件名可跳转至对应的组件详情页面。
在组件详情页面选择[部署拓扑]页签,单击进程列表中某进程对应的<停止>按钮并在弹窗中进行确定后,即可停止该进程。
· 在大数据集群中,仅部分组件的部分进程支持重启操作,详情请以实际页面为准。 · 执行重启进程操作的过程中,会中断该进程及与其有依赖关系的其他组件上的业务访问。 |
集群在使用过程中,根据实际需要,可执行重启进程的操作。
在集群管理的左侧导航树中选择[集群列表],进入集群列表页面。
在集群列表页面,单击某集群名称可跳转至对应的集群详情页面。
在集群详情页面选择[组件]页签,单击组件列表中某组件名可跳转至对应的组件详情页面。
在组件详情页面选择[部署拓扑]页签,单击进程列表中某进程对应的<重启>按钮并在弹窗中进行确定后,即可重启该进程。
· 在大数据集群中,仅部分组件的部分进程支持滚动重启操作,详情请以实际页面为准。 · 执行滚动重启进程操作的过程中,可能会影响正在运行中的相关业务。 |
集群在使用过程中,支持对某一组件进程执行滚动重启的操作,实现批量重启所有进程的目的。
在集群管理的左侧导航树中选择[集群列表],进入集群列表页面。
在集群列表页面,单击某集群名称可跳转至对应的集群详情页面。
在集群详情页面选择[组件]页签,单击组件列表中某组件名进入组件详情页面,在右上角组件操作的下拉框中选择滚动重启某一进程按钮(具体按钮名以页面为准),即可执行对应操作。比如:在HDFS组件详情页面,在右上角组件操作的下拉框中选择<滚动重启DataNode>按钮,会弹出滚动重启DataNode窗口,此时根据窗口提示,需要配置以下信息:
单次启动进程数:滚动重启操作执行时,每一次重启操作对应的进程数量。
重启任务间隔(s):滚动重启操作执行时,每两次重启操作之间的时间间隔。
最大失败次数:滚动重启操作执行时,每一次重启操作允许的最大失败次数,若超过最大失败次数则直接跳过此次重启,继续执行后续的重启操作。
【示例】对于6节点的HDFS集群,配置滚动重启DataNode操作时:单次启动进程数为2,重启任务间隔为120s,最大失败次数为3,则表示在滚动重启DataNode操作执行过程中,每次重启2个DataNode节点,两次重启操作之间间隔120s。如果遇到重启失败的情况,每有一个DataNode节点重启失败,则失败次数+1,并且会跳过失败节点继续依次对其他DataNode执行滚动重启。当超过设置的“最大失败次数”后,滚动重启操作会结束;若所有DataNode节点均已执行过滚动重启操作,即使此时仍未超过设置的“最大失败次数”,滚动重启操作也会结束。
配置完成后,单击<确定>按钮即可对HDFS的所有DataNode进程执行滚动重启操作。
滚动重启进程的操作启动后请查看组件操作记录,在组件操作记录列表中可查看到此任务,且此时可以查看滚动重启进度以及执行过程的详情信息。
· 当DataNode进程个数大于3时,才可执行DataNode下线操作。 · DataNode执行下线操作前,必须保证其对应节点已使用的磁盘容量小于其它节点未使用磁盘容量的80%且HDFS磁盘总使用容量未超过80%,否则,系统会提示“其他的DataNode空间不足会影响当前DataNode下线,请清理HDFS后再进行下线”。 · DataNode下线期间请勿停止或重启HDFS组件或进程,下线完成后请立即缩容或删除当前DataNode进程,否则会引起DataNode异常。 · 请勿频繁重复执行上线和下线操作,否则会引起对应DataNode异常。 |
集群在使用过程中,根据实际需要(比如:缩容或删除DataNode进程前),可对HDFS执行DataNode下线操作,进行数据迁移。
在集群管理的左侧导航树中选择[集群列表],进入集群列表页面。
在集群列表页面,单击某集群名称可跳转至对应的集群详情页面。
在集群详情页面选择[组件]页签,单击组件列表中HDFS名称进入组件详情页面,在[部署拓扑]页签的进程列表中单击某DataNode进程对应的<下线>按钮,并在弹窗中单击<确定>按钮,即可进行DataNode下线。
· 当DataNode进程个数大于3时且处于下线中或已下线状态时,才可执行DataNode上线操作。 · 请勿频繁重复执行上线和下线操作,否则会引起对应DataNode异常。 |
集群在使用过程中,若由于误操作导致DataNode处于下线中或已下线状态时,可执行DataNode上线操作。
在集群管理的左侧导航树中选择[集群列表],进入集群列表页面。
在集群列表页面,单击某集群名称可跳转至对应的集群详情页面。
在集群详情页面选择[组件]页签,单击组件列表中HDFS名称进入组件详情页面,在[部署拓扑]页签的进程列表中,单击某个处于已下线或下线中状态的DataNode进程对应的<上线>按钮,并在弹窗中单击<确定>按钮,等待一段时间后,即可完成DataNode上线。
· 当前版本,在大数据集群中,仅Elasticsearch开启多实例时支持查看多实例操作。 · 执行停止/重启实例操作之后,将中止该实例及与其有依赖关系的其他组件上的业务访问。若该实例上有任务正在运行,业务将中断。 · 执行停止/重启实例操作,若集群中有业务正在进行读写操作,则可能产生坏文件或者数据丢失。 |
集群在使用过程中,根据实际需要,可对Elasticsearch执行查看多实例的操作。
在集群管理的左侧导航树中选择[集群列表],进入集群列表页面。
在集群列表页面,单击某集群名称可跳转至对应的集群详情页面。
在集群详情页面选择[组件]页签,单击组件列表中Elasticsearch名称进入组件详情页面,在部署拓扑页签的进程列表中单击某进程对应的<查看多实例>按钮,弹出ES多实例窗口。
在ES多实例窗口,可查看Elasticsearch当前进程上的所有实例及实例详情信息。此时可对插件执行以下操作:
停止:单击某个已启动的实例对应的<停止>按钮并在弹窗中进行确定后,即可停止该实例。
开启:单击某个已停止的实例对应的<开启>按钮并在弹窗中进行确定后,即可开启该实例。
重启:单击某实例对应的<重启>按钮并在弹窗中进行确定后,即可重启该实例。
单击<关闭>按钮,即可关闭ES多实例窗口。
· 在生产环境中,删除进程功能不可回退或暂停,请谨慎使用。执行删除进程操作会删除该进程上的所有业务,造成不可逆的业务中断。 · 处于“已启动”状态下的进程,不可执行删除操作,即需先停止进程后再执行删除进程操作。 · 在大数据集群中,仅部分组件的部分进程支持删除操作,详情请以实际页面为准。 · 部分组件执行删除进程,会导致数据重新分布,造成一定的性能损耗。 · 在租户集群中删除组件(Kafka、HDFS、Hive、HBase、YARN)的进程,可能会导致租户已申请的资源容量超出当前组件的容量,此时请根据实际情况自行调整租户的合理配额。 · 执行删除进程操作之后,需要手动重启相关受影响的组件,但是重启操作可能会导致正在运行的业务中断。 |
集群在使用过程中,根据实际需要,可执行删除进程的操作。
在集群管理的左侧导航树中选择[集群列表],进入集群列表页面。
在集群列表页面,单击某集群名称可跳转至对应的集群详情页面。
在集群详情页面选择[组件]页签,单击组件列表中某组件名可跳转至对应的组件详情页面。
在组件详情页面选择[部署拓扑]页签,单击进程列表中某进程对应的<删除>按钮并在弹窗中进行确定后,即可删除该进程。