刚才查看proxmox集群运行状态,没想健康状态那里出个大红叉。web
虽然不影响业务,但有问题,仍是得立刻处理。鼠标点这个红叉,看看具体是什么报错!bash
再点第二个小红叉后边的“i”图标,更详细的信息出来了,以下图所示:ide
原来是一个pg故障,尝试用ceph进行修复,具体的操做以下:spa
ü 登陆系统(debian)肯定问题是否如web管理页面的错误相一致orm
root@pve47:~# ceph health detail HEALTH_ERR 5 scrub errors; Possible data damage: 1 pg inconsistent OSD_SCRUB_ERRORS 5 scrub errors PG_DAMAGED Possible data damage: 1 pg inconsistent pg 2.162 is active+clean+inconsistent, acting [3,0,10]
root@pve47:~# ceph health detailblog
HEALTH_ERR 5 scrub errors; Possible data damage: 1 pg inconsistentit
OSD_SCRUB_ERRORS 5 scrub errorsclass
PG_DAMAGED Possible data damage: 1 pg inconsistent集群
pg 2.162 is active+clean+inconsistent, acting [3,0,10]登录
从输出可知,确实发生了故障。
ü 执行修复
root@pve47:~# ceph pg repair 2.162 instructing pg 2.162 on osd.3 to repair
root@pve47:~# ceph pg repair 2.162
instructing pg 2.162 on osd.3 to repair
从修复输出可知,发生故障的磁盘是osd.3,那么就在proxmox的web管理界面界面找到它。
ü 选中磁盘osd.3,而后鼠标点击重载。等待片刻,再换回到数据中心界面进行查看。
运气还不错,故障得以恢复!