系统环境:
IBM System X3650 7945o45 raid 5
固定IP接入
centos 5.5 64位+nginx 0.8+php5.2
故障:
不知为什么 这些天服务器老是自动断网,每天自动断n次,然后马上到机柜接上显示器,执行nginx和php重启t命令后 网络马上恢复,这些天就是这样反反复复 ,系统也重新安装过,没有任何效果 服务器负载超低,断网后接上显示器,只要执行一下 执行nginx和php重启t命令 网络马上恢复正常,重装过系统 问题依旧,检查/var/log/message 发现很多
printk: n(数字) messages suppressed.
TCP: time wait bucket table overflow
然后执行echo 500000 > /proc/sys/net/ipv4/tcp_max_tw_buckets,
上面那种提示消失,但是问题依旧,
分析了/var/log/message,也没有发现网络类的错误或警告信息/usr/local/nginx/logs/error.log内容为空
此服务器只安装了 nginx+php
mysql数据库在另外一台server 2008上面
实在找不出原因在哪里,我个人认为网卡驱动问题的可能性不大,因为其他服务器均是ibm system x3650 使用默认的bnx2,运行一直正常,其他两台windows server 2008网络正常(它们在同一交换机,使用同一网关,同一IP段)
想请教一下 这种情况有没有可能是php程序代码问题所引起呢,请帮判断下故障点 谢谢
IBM System X3650 7945o45 raid 5
固定IP接入
centos 5.5 64位+nginx 0.8+php5.2
故障:
不知为什么 这些天服务器老是自动断网,每天自动断n次,然后马上到机柜接上显示器,执行nginx和php重启t命令后 网络马上恢复,这些天就是这样反反复复 ,系统也重新安装过,没有任何效果 服务器负载超低,断网后接上显示器,只要执行一下 执行nginx和php重启t命令 网络马上恢复正常,重装过系统 问题依旧,检查/var/log/message 发现很多
printk: n(数字) messages suppressed.
TCP: time wait bucket table overflow
然后执行echo 500000 > /proc/sys/net/ipv4/tcp_max_tw_buckets,
上面那种提示消失,但是问题依旧,
分析了/var/log/message,也没有发现网络类的错误或警告信息/usr/local/nginx/logs/error.log内容为空
此服务器只安装了 nginx+php
mysql数据库在另外一台server 2008上面
实在找不出原因在哪里,我个人认为网卡驱动问题的可能性不大,因为其他服务器均是ibm system x3650 使用默认的bnx2,运行一直正常,其他两台windows server 2008网络正常(它们在同一交换机,使用同一网关,同一IP段)
想请教一下 这种情况有没有可能是php程序代码问题所引起呢,请帮判断下故障点 谢谢
0
1. 首先看看你的服务器上连接数多不多
netstat -an |wc -l
// 如果高于1w 就算高了,否则不高
2. 判断出是重启php后网络恢复,还是重启nginx 网络恢复
3. 根据第2步的判断,更换php或者nginx的版本
4. 更改版本后,如果问题依旧,则能够判定问题出在了php程序上
我有个问题,你的服务器上有几个网卡,如果有内网和外网,那么断的是内外网,还是只是外网?
netstat -an |wc -l
// 如果高于1w 就算高了,否则不高
2. 判断出是重启php后网络恢复,还是重启nginx 网络恢复
3. 根据第2步的判断,更换php或者nginx的版本
4. 更改版本后,如果问题依旧,则能够判定问题出在了php程序上
我有个问题,你的服务器上有几个网卡,如果有内网和外网,那么断的是内外网,还是只是外网?
0
2# lishiming2009
1. 首先看看你的服务器上连接数多不多 netstat -an |wc -l
答:连接数很低 只有600多,上周网站日访问量在10万左右,这周服务器不稳定 直线下滑,现在并发连接都在1000以内。
2. 判断出是重启php后网络恢复,还是重启nginx 网络恢复
答:这个还未注意,一直发现问题 马上就直接用重启脚本重启了,那时候发现,服务器的上传tx流量达到40多M甚至90多M/秒,一秒3万多个数据包发出,而rx下行流量则正常在几百K。
3.你的服务器上有几个网卡,如果有内网和外网,那么断的是内外网,还是只是外网?
答:服务器有两个网卡,断网的是外网那个网卡,之前外网在eth0上 后来也调整到另外一个网卡eth1试过,问题依旧
拓扑如下
刚开始 断网后 我就要跑到机柜 接上显示器,执行nginx+php那个重启脚本,后来找了条网线(网线a),将centos的另外一个网卡和 数据库服务器另外一个网卡连接了,centos地址是192.168.1.3 网关为空,数据库服务器另外一个网卡地址是192.168.1.22 网关为空 当外网断掉的时候 登录数据库服务器 ssh连接192.168.1.3还是可以的,现在就是 如果外网断了 就登录数据库服务器连接192.168.1.3 重启nginx和web,郁闷的是 每次断网都是 外网网卡上传流量巨大,我觉得如果是DDOS攻击的话 应该是rx接收流量才对,而tx发送流量那么大就不解了,LInux中毒机率太低(我们很多台Linux服务器从未出现过中毒),就算中毒也可能是网页木马。个人的见解,为了排除网页木马的可能,我 vi /usr/local/php/etc/php.ini 禁用了以下函数(10:30分刚添加的)
disable_functions = passthru,exec,shell_exec,system,set_time_limit,ini_alter,dl,
pfsockopen,openlog,syslog,readlink,symlink,link,leak,fsockopen,popen,escapeshell
cmd,error_log
另附/var/log/message尾部内容和/var/log/secure
现在流量统计
1. 首先看看你的服务器上连接数多不多 netstat -an |wc -l
答:连接数很低 只有600多,上周网站日访问量在10万左右,这周服务器不稳定 直线下滑,现在并发连接都在1000以内。
2. 判断出是重启php后网络恢复,还是重启nginx 网络恢复
答:这个还未注意,一直发现问题 马上就直接用重启脚本重启了,那时候发现,服务器的上传tx流量达到40多M甚至90多M/秒,一秒3万多个数据包发出,而rx下行流量则正常在几百K。
3.你的服务器上有几个网卡,如果有内网和外网,那么断的是内外网,还是只是外网?
答:服务器有两个网卡,断网的是外网那个网卡,之前外网在eth0上 后来也调整到另外一个网卡eth1试过,问题依旧
拓扑如下
刚开始 断网后 我就要跑到机柜 接上显示器,执行nginx+php那个重启脚本,后来找了条网线(网线a),将centos的另外一个网卡和 数据库服务器另外一个网卡连接了,centos地址是192.168.1.3 网关为空,数据库服务器另外一个网卡地址是192.168.1.22 网关为空 当外网断掉的时候 登录数据库服务器 ssh连接192.168.1.3还是可以的,现在就是 如果外网断了 就登录数据库服务器连接192.168.1.3 重启nginx和web,郁闷的是 每次断网都是 外网网卡上传流量巨大,我觉得如果是DDOS攻击的话 应该是rx接收流量才对,而tx发送流量那么大就不解了,LInux中毒机率太低(我们很多台Linux服务器从未出现过中毒),就算中毒也可能是网页木马。个人的见解,为了排除网页木马的可能,我 vi /usr/local/php/etc/php.ini 禁用了以下函数(10:30分刚添加的)
disable_functions = passthru,exec,shell_exec,system,set_time_limit,ini_alter,dl,
pfsockopen,openlog,syslog,readlink,symlink,link,leak,fsockopen,popen,escapeshell
cmd,error_log
另附/var/log/message尾部内容和/var/log/secure
现在流量统计
编辑回复