一,这个问题和systemd-journald有关,故咱们先简单了解下:
html
过去只有 rsyslogd 的年代中,因为 rsyslogd 必需要开机完成而且执行了 rsyslogd 这个 daemon 以后,登陆文件才会开始记录。因此,核心还得要本身产生一个 klogd 的服务, 才能将系统在开机过程、启动服务的过程当中的信息记录下来,而后等 rsyslogd 启动后才传送给它来处理。linux
如今有了 systemd 以后,systemd 使用systemd-journald统一管理全部 Unit 的启动日志。因为systemd是kernel唤醒的,而后又是第一个执行的软件,它能够主动调用 systemd-journald 来协助记载登陆信息。所以在开机过程当中的全部信息,包括启动服务与服务若启动失败的状况等等,均可以直接被记录到 systemd-journald 里头去!nginx
不过 systemd-journald 因为是使用于内存的登陆文件记录方式,所以从新开机事后,开机前的登陆文件信息固然就不会被记载了。 为此,咱们仍是建议启动 rsyslogd 来协助分类记录!也就是说, systemd-journald 用来管理与查询此次开机后的登陆信息,而 rsyslogd 能够用来记录之前及如今的因此数据到磁盘文件中,方便将来进行查询!web
二,问题场景:vim
一台centos7系统有load高的报警,故登陆上去查看,发现系统很卡,系统磁盘io吃的比较多。以后,发现不少systemctl status的进程,而且这种进程占用系统io不少。 centos
问题分析定位:koa
1,centos7的bugide
2,systemctl的问题 post
三,解决过程:centos7
1,centos7已经用了很长时间,目前处于稳定,而且翻看centos7的bug list未发现有相似异常。故排除了系统bug。
2,开始查找systemctl的问题,果不其然发现是systemd-journald的问题。
1)strace命令查看问题,发现是读取systemd-journald日志比较慢
# strace -s 1024 systemctl status nginx
2)查看status输出:
# systemctl status nginx
● nginx.service - nginx - high performance web server
Loaded: loaded (/usr/lib/systemd/system/nginx.service; disabled; vendor preset: disabled)
Active: active (running) since 一 2018-01-08 18:25:37 CST; 2h 20min ago
Docs: http://nginx.org/en/docs/
Main PID: 22403 (nginx)
CGroup: /system.slice/nginx.service
├─22403 nginx: master process /usr/sbin/nginx -c /etc/nginx/nginx.conf
├─22404 nginx: worker process
├─22405 nginx: worker process
├─22408 nginx: worker process
1月 08 18:25:37 test systemd[1]: Starting nginx - high performance web server...
1月 08 18:25:37 test nginx[22398]: nginx: the configuration file /etc/nginx/nginx.conf syntax is ok
1月 08 18:25:37 test nginx[22398]: nginx: configuration file /etc/nginx/nginx.conf test is successful
1月 08 18:25:37 test systemd[1]: Started nginx - high performance web server.
能够看到systemctl有的输出有nginx启动时候相关的信息。而这些输出是从systemd-journald中读取的。
3)systemd-journald的日志默认是存储在/run/log/journal目录,发现这个目录已经有4G了。查看网上相关资料,发现也有其它人碰见过相似的问题。能够经过修改systemd-journald的配置来解决问题:
# vim /etc/systemd/journald.conf
SystemMaxUse=100M
RuntimeMaxUse=100M
###
SystemMaxUse= 与 RuntimeMaxUse= 限制所有日志文件加在一块儿最多能够占用多少空间。而SystemMaxUse= 与 RuntimeMaxUse= 的默认值是10%空间与4G空间二者中的较小者,故把这两个配置调小了。
重启systemd-journald:
# systemctl restart systemd-journald
4)操做完成以后发现系统load慢慢降了下来,systemctl status命令也变快了。
四,结论:
1,经过限制systemd-journald日志的大小来解决这个问题。反作用是保存的日志变少,可是可接受,目前没有发现有异常。
五,参考:
http://shouce.jb51.net/vbird-linux-basic-4/160.html
http://www.jinbuguo.com/systemd/journald.conf.html
http://www.codekoala.com/posts/systemctl-status-foo-was-too-slow/