首先确认是否是虚拟机、网络故障,底层故障处理
PID文件未清理导致进程启动失败
问题现象
收到告警CM服务异常,查看集群状态,CM节点显示DOWN
问题分析及定界
step1.登录到故障对应CMS节点 cd $GAUSSLOG/cm/cm_server
step2.打开对应时间点的cm_server*.log中是否含有关键词:
failed to create the cm server pid file
step3.如果有关键词,则此问题是由于虚拟机故障导致pid文件残留导致参照处理步骤方法一
处理步骤
方法一:
cm_ctl query -Cvd 查看对应CMS的数据目录,到数据目录下删除对应的cm_server.pid文件即可恢复
磁盘故障
问题现象
收到告警CM服务异常,查看集群状态,CM节点显示DOWN
问题分析及定界
step1.登录到故障对应CMS节点
step2.检查磁盘是否故障或占满
处理步骤
方法一:
确认磁盘占满的原因,对磁盘进行清理(如果是日志盘,可清理一个月以前的日志文件)