解决Oracle+weblogic系统死机的问题

前段时间发布的系统(Oracle+weblogic)频繁挂掉,天天早上9点、下午2点高峰期就挂,纠结了很长时间,最终解决,方法描述下。web

执行select count(*),status from v$session group by status;指令,发现不活动链接数比较大,当上升到必定数值之和,就挂。数据库

作了下面优化,包括数据库的优化和WebLogic的优化。服务器

一、数据库优化session

1)  建立pfile SQL>create pfile from spfile并发

检查oracle

  • oracle/product/10.1.0/admin/orcl/pfile/init.ora.XXXXXXXX'(准确路径:/oracle/admin/ORADB/pfile/init.ora.352012231626)文件是否存在,备份到本地。

2)  web服务,备份数据库,备份发布的代码less

3)  查看参数并记录优化

    一、show parameter sgaspa

二、查看PGA_AGGREGATE_TARGET值操作系统

SELECT NAME, VALUE/1024/1024 MB

FROM v$pgastat

WHERE NAME IN ('aggregate PGA target parameter', 'global memory bound');

 

4)  修改pfile的内容

--alter system set sga_max_size=4096M scope=spfile ;

--alter system set sga_target= 4096M scope=spfile;

--alter system set pga_aggregate_target=2048M  scope=spfile ;

alter system set pre_page_sga=true scope=spfile ;

alter system set lock_sga=true scope=spfile;

    alter system set workarea_size_policy=auto scope=spfile ;

5)  修改limits.conf并重启电脑

/etc/security/limits.conf这个配置文件中添加以下的一行(oracle是启动数据库的操做系统帐号),意思是oracle用户能够在物理内存中锁住任意大的空间:

oracle - memlock unlimited

 而后重启操做系统reboot

6)  若是启动数据库失败,执行修复

startup pfile='……/product/10.1.0/admin/orcl/pfile/init.ora.XXXXXXXX'

7)  修改oracle链接池,并重启数据库

Oracle的sessions和processes的关系是
    sessions=1.1*processes + 5

 

SQL>show parameter processes;

SQL>alter system set processes=1000 scope = spfile;

SQL>show parameter session;

SQL>alter system set sessions=1105 scope = spfile;

 

二、优化WebLogic

 

 

1)  修改web服务器链接池

 

 weblogic所在服务器尚有26G内存,为知足1000并发访问量,能够将数据源链接池最高设置为2000。

 

 初始容量改成500    当前设置值3

 

最大容量改成2000   当前设置值200

 

容量增加改成100     当前设置值3

 

从新启动weblogic

 

 

 

2)  修改web服务器JVM内存大小(参数待定)

 

找到安装目录下的weblogic\common\bin\commEnv.cmd文件

 

打开修改以下代码:

 

sun

 

if "%PRODUCTION_MODE%" == "true" goto sun_prod_mode

 

set JAVA_VM=-client

 

             set MEM_ARGS=-Xms1024mm-Xmx2048mm-XX:MaxPermSize=256m

 

 

 

set JAVA_OPTIONS=%JAVA_OPTIONS% -Xverify:none goto continue :sun_prod_mode set JAVA_VM=-server ...

 

 

 

3)  发布新版程序

 

4)  重启web服务器操做系统

 

三、最终解决

通过上述处理,系统有明显优化,可是天天死机3次,早上8点,10点,下午3点左右。

 通过执行下面2个指令,分别查看线程的活动状况和堆栈信息状况,能够跟踪到哪一个方法致使系统堆栈延迟。

 top -H 这个命令是查看是哪一个线成比较忙

 jstack -l 8032 | less  这个命令是查看堆栈信息,堆栈延迟中能够看到是执行了什么方法致使的。没有延迟就看不到,有延迟就能看到哪一个方法致使系统堵塞,后来发现有个方法代码效率很低,并且访问最频繁,访问高峰时间正好和死机的时间吻合。

优化方法以后,系统稳定了。

相关文章
相关标签/搜索