web服务器是用tengine+php5.5,用的是阿里云ECS
访问量没有多少,但是内存总是在90%以上。
查看占用内存前10个进程
ps -aux | sort -k4nr | head -n 10
发现大多数进程都是php-fpm
重启php-fpm还是一样的。
释放内存
echo 1 > /proc/sys/vm/drop_caches
还是在89%左右
安装nmon,分析内存占用工具
yum install -y nmon
执行一下
nmon
按一下m键(内存),就可以看到如下界面
MB MB MB
Cached= 481.3 Active= 1066.2
Buffers=54.6 Swapcached=0.0 Inactive =195.3
Dirty=0.6 Writeback =0.0 Mapped =39.2
Slab=224.5 Commit_AS =3071.4 PageTables=114.9
发现slab特别大,应该是这个原因(slabtop)
然后释放缓存,等待15秒
echo 2 > /proc/sys/vm/drop_caches
再次查看,发现内存正常了,为10%。
[root@iZ23l etc]# free -m
total used free shared buffers cached
Mem: 15948 1502 14445 0 51 427
-/+ buffers/cache: 1022 14925
Swap: 0 0 0
本文参考
http://ju.outofmemory.cn/entry/170007
说明:
之前服务器,因为开启以下2个参数
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_tw_recycle = 1
导致外网APP用户,在wifi情况下,登陆超时。3G,4G网络正常。
把这2个参数关闭之后,就正常了。
随之而来的问题,就是TIME_WAIT急剧增加,一度增加到12万。
所以net.ipv4.tcp_max_tw_buckets = 200000 参数增加到20万,messages日志就没有报错了。
之后发现内存,一度在90%左右。因为保持TIME_WAIT需要占用一定的内存,以为是TIME_WAIT导致的内存升高,所以将net.ipv4.tcp_tw_reuse = 0设置为0,TIME_WAIT由17000降低至13000。但是内存只降低了1G左右,效果甚微。
每到周末放假,就内存告警。烦死了,本来想增加内存的,被老大驳回了(访问量没有多少,内存却要增加,不能接受)。哎,就只能自己想办法搞定了。
将net.ipv4.tcp_tw_recycle = 1设置为1(这个会导致nat网络环境连接超时),几分钟之后,IME_WAIT降低至100左右,但是内存还是没有降低多少。
所以说不是TIME_WAIT导致的。
后来参考上面的链接,发现,果然内存降低了。