Hadoop服务管理

来自CloudWiki
跳转至: 导航搜索

在页面左侧的服务列表中,可以选中任何一个想要操作的服务。以 HDFS为例,单击左侧服务列表中的“HDFS”按钮后,就会在服务列表右侧看到该服务的相关信息,如图2-11所示。

[1519998455550082082.jpg]

图2-11 HDFS概要展示页面

单击HDFS的“概要”标签,可以看到HDFS运行的进程信息,包括运行状态、资源使用情况以及监控信息。单击页面导航栏的“服务”按钮,然后单击导航栏下的“服务操作”的按钮,可以在弹出的下拉菜单中看到很多服务的控制命令,如“启动”、“停止”、“重启”等命令,如图2-11所示。通过这些控制命令,可以对服务进行管理。

Hadoop的集群部署完成后,并不知道这个集群是否可用。这时候就可以借助“运行服务检查”命令来确保集群服务可以正常运行。选择这个命令后,就会在弹出的对话框中出现如图2-12所示的HDFS服务操作进度显示。

[1519998455963057728.gif]

图2-12 HDFS服务操作进度显示

其实这里就是通过往HDFS文件系统/tmp目录中上传一个临时文件来检测系统运行是否正常。当进度条执行完毕后,全绿代表服务运行正常,全红代表服务运行失败,黄色代表出现告警信息。

“服务操作”下拉菜单中的“启动”、“停止”、“重启所有”3个命令的含义分别是指:启动、停止、重启集群中所有该服务的进程。当执行进度页面打开时,可以进入查看每个主机进程的操作进度和运行log,如图2-13所示。

[1519998457135092222.jpg]

图2-13 HDFS服务重启界面

在“服务操作”下拉菜单中,有一个“打开维护模式”的命令。该命令为了让用户在调试或者维护时抑制不必要的告警信息,以及避免批量操作的影响(启动所有服务、停止所有服务、重启所有服务等)。维护模式中有不同的级别设置,分别是服务级别,主机级别,以及进程级别。3种级别之间存在着覆盖关系。例如HDFS,由于HDFS部署在多台主机中,当它的维护模式打开后,HDFS便不会产生任何新的告警。当用户重启集群所有服务时,该服务会越过这个批量操作。当用户重启一个机器的所有进程时,该服务的进程也会被越过。

在“主界面”左侧的服务列表的最下方,有一个“动作”按钮,单击该按钮可以打开对服务进行操作的下拉菜单,菜单中包含有“增加服务”、“启动所有服务”和“停止所有服务”等命令。