公司服务器最近几天一直报错误,大概运行一天就报以下异常。java
java.net.SocketException: No buffer space available (maximum connections reached?): JVM_Bindweb
搞的非常郁闷,转载篇文章,貌似很全面,试试看。sql
一个朋友让我帮忙解决他服务器上一个JAVA应用出现的问题,我利用业务时间赶赴现场两次,终于解决了这个疑难杂症,赶忙记录下来,不求能解救曾经和我同样困惑的劳苦大众,希望本身别忘了。数据库
1、问题的表现小程序
首先说明一下环境,服务器是WINDOWS SERVER 2003,我对这个操做系统的特性不是很熟悉,只是当作普通的我的版操做系统来使用。我平时通常JAVA服务器都是安装LINUX。windows
数据库使用的SQL SERVER 2005,SP2。他的数据库原本是SQL SERVER 2000的,是我上周帮他作的迁移。缓存
中间件使用RESIN 2.1.17,这是我很是喜欢和熟悉的SERVLET容器,加不加装APACHE都具备很好的WEB服务性能。sass
杀毒软件使用的瑞星,双网卡,硬件防火墙,什么牌子我没管。服务器
那究竟是什么问题?网络
这个!
com.microsoft.sqlserver.jdbc.SQLServerException: 到主机 的 TCP/IP 链接失败。 java.net.SocketException: No buffer space available (maximum connections reached?): JVM_Bind
RESIN启动后,在短期内正常,可是在没有访问的状况下,会在几个小时后,本身死掉。静态页面没有问题,也就是基于HTTPWEB服务器没有死,涉及数据库链接的,都不行。
2、分析
我是第一次碰到这个错误,赶忙GOOGLE。
我首先本身排除了是程序的问题,网上有人说,是数据库链接没有关闭,这样的同志都是新手,并且我本身也能够确定,程序是确定没有问题的,这个错误,出现的位置绝对比数据库链接要底层的多。
网上的文章很是少,都看了一遍,总结一共有如下几个缘由。
1. Windows服务器运行自动更新。具体为何自动更新运行后,就会消耗系统这么多的SOCKET 链接,我还搞不清楚。可是有一点,自动更新确定会占用网络带宽和CPU,在服务器上,我以为应该是关闭自动更新的,采用人工更新的方法。
2.机器中了木马。木马会打开不少后门,建立大量的链接,包括局域网肉鸡上的,还有外网的。这也会致使机器出现没法上网,或者程序没法链接。在搜索到的结果中,大量的结果都是采用的SQLSERVER数据库服务器,这是很容易招来木马和病毒的服务器,大部分是SQLSERVER出问题,不是偶然的。
3.虚拟内存配置太低。第一次发现这个问题后,我到现场打开机器,确实报了一个虚拟内存的错误,说虚拟内容不足。
4.有不当程序建立了大量的短链接,因为程序的不健壮,致使SOCKET处于忙碌或者TIME_WAIT状态,或者服务器和客户端有一方出现异常,而另外一方没有获得通知,还在链接,持续不断的作写操做。
3、动手解决
通过分析,将准备采起的措施一一写下来,个人脑壳不太好用,容易忘记东西。
措施以下,先作什么,后作什么,看到这篇文章的朋友,能够本身调整。
1. 优化RESIN的配置,适当的扩大链接池的数量,虽然不是这个问题,仍是稍微扩大一点。配置了远程监控,关闭了默认没有作的目录浏览,屏蔽了404等错误;使用HTTPD -INSTALL将RESIN安装入服务,原来个人朋友是直接启动的控制台,这容易致使程序在控制台缓存到顶后中止。关闭了HIBERNATE的SHOW_SQL开关。
2.关闭自动更新,而且关闭Background Intelligent Transfer Service服务。打开服务的时候,发现服务窗口5秒后会自动关闭,并且奇怪的服务很是多。同时看到NORTON已经被自动禁用了,打也打不开,得,这机器的病毒还很多。
3.杀毒。不看不知道,一看吓一跳。我这哥们真是个大猛男,妈的,各类病毒都中了,还服务呢,这SERVER真是可怜啊!病了主人也不给看病,为国家服务的机器,不可能没有医保嘛。亲爸无论叔叔来给你治病。通过分析,中的病毒有U盘病毒,还有RUNAUTO..病毒,灰鸽子,传奇木马,各类不知名的后门和木马,还被安装了一个远程控制的小东西。下载了一个360,想偷懒,结果根本没法安装。删除了RUNAUTO..,(我之前的博客有专门描述怎么对付这玩意的)结果C盘都打不开了,只能在资源管理器中打开。还挺麻烦。因而找到病毒几个藏身之所,分析了未知服务,用DOS删除不掉,仍是360的文件粉碎有用。什么c:\windows\lsass.exe等等,cmd.exe.exe这都太普通了。具体过程也不是很清楚了,总之最后360能够安装并更新了。360这东西确实好,木马都清除了。如今服务窗口也不自动关闭了,NORTON也正常监控,机器没有异常打开的端口,没有莫名其妙的服务,恩,差很少了。
4.优化服务器设置。其实我也不知道这么优化。看了看,虚拟内存都在C盘,C盘空间已经很是少了,找了点看的明白的东西,往别的盘搬了搬,看不懂的,不敢随便给人家动。从新打开服务窗口,没什么用的服务都开着,把我肯定的都关闭,什么SERVER服务,还开着ADMIN$呢,赶忙都关了,他这机器根本用不着。还有什么IIS,APACHE,开的还真全,我看还安装了TOMCAT了,干脆加上RESIN全打开算了,那真是够热闹的,万马齐喑。我固然不容许这事出现,全干掉。
5.检查是否某个程序有漏洞。因为我本身在RESIN下还配置了一个只有我本身连GOOGLE的机器人都没法发现(而且也拒绝了机器人扫描)的小工具,以前就看到有外网IP不时的建立大量的链接,但都处于TIME_WAIT状态。这也很要命。看了一下,除了这个WEB应用,还有一个天天自动接收数据的小程序。这个程序是使用的SOCKET长链接仍是短链接就不知道了,有朋友关心这方面的内容能够详细GOOGLE一下。可是这个程序确实是没有被配置为开机自动运行(我给加上了),多是外网那个IP上的客户端在不断的寻求链接吧!SOCKET.close()是不立刻释放链接的,而是设置为TIME_WAIT状态,这个时间默认是240S,也就是4分钟。这太长了,有30秒(最小值)就能够了。在修改这个默认值的时候,还发现这台机器并无开启大端口服务,也就是高于5000的端口。这也是会出现“系统缺少足够缓冲区空间或者由于队列已满没法执行套接字上操做”错误的!而那WEB服务就是配置到1万以上端口的!赶忙,操做方法以下:
1. 启动注册表编辑器。 HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters
2. 新建
值名称:MaxUserPort
值类型: DWORD
值数据: 65534(用十进制的方法写进去就能够,若是是十六进制,是FFFE,由于4个F是65535嘛)
有效范围: 5000 - 65534 (十进制)
默认: 0x1388 5000 (十进制)
新建
值名称:TCPTimedWaitDelay
值类型: DWORD
值数据: 0000001e(也就是30,不行能够用WINDOWS计算器,很方便,这个表示TIME_WAIT的秒数)
OK!
通过一番折腾,我在震耳欲聋的轰鸣声中,终于安抚了这台哭泣的服务器,也驯服了几匹小木马,好好调教了个人RESIN服务器。顺便说一句,我身后有台什么爱默生服务器,隔一会就象打嗝似的叫一声,时常把我吓到……
但愿花费我1个多小时写的这个总结,对我本身确定有用,也但愿能帮到更多的朋友,转载请注明链接!