线上不出点问题, 彷佛今天就不是周五了.php
忽然报警群里出现了某一条数据, 反馈没有上报成功, 中间流程执行完, 后面没再执行了(细思极恐)html
无语。。。nginx
想了想刚才有发版, 可是不是这个引发的还不肯定 (咱们目前没有灰度发布-_-)缓存
首先我得肯定下这条数据的到达时间, error日志查, 查看业务日志是否有太重要的打点信息, 经过从access日志里面, 定位到这条问题数据请求时间为 10:22:42bash
经过查看聊天记录,10点多有个上线操做, 而且别的项目以前一上线就抱怨说可能就会有502出现, 由此我想咱们发布服务中间可能操做了什么出现的问题服务器
嗯。。万事不求人, 看下php-fpm的日志就知道啥时候上过线了(咱们构建项目会重启fpm).socket
发现php-fpm.log文件内容:php-fpm
[19-Apr-2019 10:22:42] NOTICE: Reloading in progress ...
[19-Apr-2019 10:22:42] NOTICE: reloading: execvp("/usr/local/php-fpm_9000/sbin/php-fpm", {"/usr/local/php-fp m_9000/sbin/php-fpm", "--daemonize", "--fpm-config", "/usr/local/php-fpm_9000/etc/php-fpm.conf", "--pid", "/ usr/local/php-fpm_9000/var/run/php-fpm.pid"})
[19-Apr-2019 10:22:42] NOTICE: [pool www] 'user' directive is ignored when FPM is not running as root
[19-Apr-2019 10:22:42] NOTICE: [pool www] 'user' directive is ignored when FPM is not running as root
[19-Apr-2019 10:22:42] NOTICE: [pool www] 'group' directive is ignored when FPM is not running as root
[19-Apr-2019 10:22:42] NOTICE: [pool www] 'group' directive is ignored when FPM is not running as root
[19-Apr-2019 10:22:42] NOTICE: using inherited socket fd=8, "127.0.0.1:9000"
[19-Apr-2019 10:22:42] NOTICE: using inherited socket fd=8, "127.0.0.1:9000"
[19-Apr-2019 10:22:42] NOTICE: fpm is running, pid 23324
[19-Apr-2019 10:22:42] NOTICE: ready to handle connections
复制代码
nginx错误:oop
[error] 66#0: *10 recv() failed (104: Connection reset by peer) while reading response header from upstream
复制代码
这个错误很熟悉吧,以前文章已经介绍过了.优化
发布服务重启php-fpm, 致使的代码流程执行中断.
首先思考中断可能的缘由:
这些问题应该不会, 这个被中断的服务 没有依赖的服务请求, 也没有复杂的业务逻辑.(不要问为啥没问题,由于这是我写的+_+)
借助着搜索引擎的力量, 找问题就变得傻瓜起来
记 php-fpm 重启致使的 程序执行中断问题 yq.aliyun.com/articles/22…
重启php-fpm时请求发生502错误的缘由及解决:process_control_timeout www.04007.cn/article/439…
PHP-FPM参数 www.jianshu.com/p/795a1a181…
Graceful Restart (USR2) isn't very graceful bugs.php.net/bug.php?id=…
最后详细的读了下最后一篇向官方反馈的bug, php-fpm的平滑重启不平滑
其中目前建议:
[2013-02-13 15:57 UTC] phpbugs at oops dot mooo dot com
Try setting process_control_timeout to something higher than 0.
复制代码
参数含义是 设置子进程接受主进程复用信号的超时时间. 控制子进程处理来自master的信号的时间,默认为0.若是正在处理请求, 极可能会收到错误报警。建议将此参数设置为相同的值 request_terminate_timeout,以便worker有时间完成处理请求。
<?php
echo 1;
sleep(10);
echo 3;
复制代码
访问中, 进行 kill -USR2 10 报错:
将 php-fpm.conf 的 process_control_timeout 配置为20
进行 kill -USR2 11
正常输出结果.
后续是否有反作用还须要在生产环境验证
服务发布优化也不只于此
为何要每次重启fpm
好比能不能用其余方式使缓存失效呢?
更多有趣的计算机技术关注 呆呆熊一点通 :