平台:HP-UX B.11.23 ia64
故障描述
客户反映在2009-01-19上午7点左右,应用无法连接到数据库,之后将数据库重启,并增大了PROCESSES参数。客户希望查找问题原因。
原因分析:
ALERT LOG分析:
从ALERT LOG中的信息可以看到:
Tue Jan 19 06:11:22 2010
Process J000 died, see its trace file
Tue Jan 19 06:11:22 2010
kkjcre1p: unable to spawn jobq slave process
Tue Jan 19 06:11:22 2010
Errors in file /oracle/admin/vc/bdump/vc_cjq0_16001.trc:
Tue Jan 19 06:12:33 2010
Process J000 died, see its trace file
Tue Jan 19 06:12:33 2010
kkjcre1p: unable to spawn jobq slave process
Tue Jan 19 06:12:33 2010
Errors in file /oracle/admin/vc/bdump/vc_cjq0_16001.trc:
在19号的06:11:22时出现错误:
原因是由于无法分配jobq slave process进程导致J000进程died。
从/oracle/admin/vc/bdump/vc_cjq0_16001.trc看到:
*** 2010-01-19 06:11:22.293
Process J000 is dead (pid=15748, state=3):
*** 2010-01-19 06:12:33.315
Process J000 is dead (pid=15947, state=3):
该问题出现过两次,都是由调度进程CJQ0产生的。
从同时间点的后台trace文件看到出现该问题的主要原因是达到了最大进程数限制
/oracle/admin/vc/bdump/vc_ora_15748.trc内容:
error 20 in job queue process
ORA-00020: maximum number of processes (1000) exceeded
尽管无法分配进程给job队列使用,但是并不会导致数据库宕机或挂起。数据库仅是由于达到了最大进程数限制,而导致应用无法连接。
此时数据库的状态仍然是OPEN状态,仍能通过管理员用户登入到数据库。
客户在数据库出现问题之后对数据库的操作:
06:53:41开始,使用管理员用户重启数据库实例:
Tue Jan 19 06:53:41 2010
Starting ORACLE instance (normal)
第一次启动不成功,于07:12:36将数据库shutdown abort:
Tue Jan 19 07:12:36 2010
Shutting down instance (abort)
License high water mark = 980
Instance terminated by USER, pid = 25808
之后在07:12:46时正常重启数据库,并启动成功:
Tue Jan 19 07:12:46 2010
Starting ORACLE instance (normal)
分析listener.log:
| 广告合作:400-664-0084 全国热线:400-664-0084 Copyright 2010 - 2017 www.my8848.com 珠峰网 粤ICP备15066211号 珠峰网 版权所有 All Rights Reserved
|