故障发生和修复
前段时间有一个服务报警了,后面查了一下,发现是服务连接不上 mongo 导致的, error.log 如下1
2SaveChannel error(read tcp 172.26.16.28:21544->172.26.0.8:27017: i/o timeout)
SaveChannel error(read tcp 172.26.16.28:22848->172.26.0.8:27017: i/o timeout)
这个服务中我们mongo配置的是副本集设置,也就是说,如果主副本集挂掉的话,会自动选举次副本集。刚开始以为是这台primary mongo挂掉了,但是看了一下,好像服务是正常的,而且 telnet 是可以通的。