公司的微信公众号项目,架构是使用了nginx负载均衡,随着几回的推广活动,用户从原来的1万增加到了如今的3万,在这个时候问题就出现了,每次推广活动或者推送图文消息,就会出现崩溃的状况,持续半个小时。这个问题很严重,致使流失了不少用户。
一开始的时候我考虑是数据库的问题,由于平时数据库的查询速度就比较慢,而且负载均衡分发到两台服务器都是用同一个数据库,数据库出了问题,合情合理。可是无奈把数据库迁移到另一台服务器以后,查询速度并无什么改善。静下心来反思本身先入为主的观念可能影响了判断。而后看到微信公众号的告警排查指南。说有多是nginx的问题。因而决定检查一下nginx的错误日志。果真在推广时间段内查找到大量的Too many open files日志。php
找到问题那就好解决了。百度一下。在下面连接找到了解决方法 http://www.php100.com/html/program/nginx/2013/0905/5518.html (这样引用做者不会告我把) 增大linux单线程可打开最大文件句柄。,而且顺带修改一下nginx的最大连接数。html
问题缘由。linux默认单线程打开的最大文件数不能超过1024。而nginx的实现机制是单线程轮询机制,也就是说,虽然不少连接,可是实际上是在一个线程里面运行得。linux
我把缘由告知技术总监,想让他协助我修改linux配置,由于服务器是多项目共用的,无奈他说之前他遇过这个问题,交给他就好了。又没有了show time~~nginx