Linux grep命令与$?命令结合使用技巧

发布时间 2023-07-13 22:45:46作者: 潇湘隐者

今天检查前同事留下的一个shell脚本时,其中一个脚本中有一个业务逻辑处理:要判断Oracle数据库实例是否启动,如果数据库实例处于OPEN状态的话,则执行/运行一些业务逻辑操作。脚本大体如下(脚本做了一下混淆和精简收缩)

up_flag=`${SCRIPT_DIR}/chkdbup.sh ${ORACLE_SID}`

if [ ${up_flag} -eq 0 ]; then 
  .......
  exit
else
  .......
fi

其中chkdbup.sh脚本的内容如下:

ps -ef | grep -i smon_${1} | grep -v "grep" >/dev/null 
echo $?

Review这个脚本时,我感觉这个脚本的逻辑有问题(我认为这个脚本存在一个逻辑"bug"),主要是{up_flag}不为0时则表示数据库实例异常了

if [ ${up_flag} -eq 0 ]; then 
  .......
  exit
else
  .......
fi

在Linux shell脚本中,$?一般表示上一个命令的返回值(执行情况),执行成功,返回0,其他任何数值表示上条命令执行有错误。我认为数据库实例OPEN或关闭或crash的时候,chkdbup.sh这个脚本都会返回0,而不会返回值1,为了验证我的想法,于是我找了台测试环境验证测试一下。当前测试环境下ORACLE_SID为kerry

[oracle@mytestdb ~]$ ps -ef | grep -i smon_kerry | grep -v "grep"
oracle   1338965       1  0 Jul05 ?        00:00:14 ora_smon_kerry
[oracle@mytestdb ~]$ echo $?
0

换一个ORACLE_SID,此时因为Oracle实例不存在,就可以模拟实例Crash的情况(懒得关闭Oracle实例了,这个跟关闭Oracle实例测试效果一致)

[oracle@mytestdb ~]$ ps -ef | grep -i smon_gsp | grep -v "grep"
[oracle@mytestdb ~]$ echo $?
1

按照我的想法/认知,不管这个数据库实例存在或不存在,ps命令总是会执行成功,它就会返回0,而且是永远返回0,但是测试验证结果跟我的想法/认知不符合,Why?查了一些资料,然后和同事讨论后,终于搞清楚了其中的原因,主要是因为$?命令获取的上一条命令的返回结果,而上一条命令中使用了grep命令,而grep命令的返回结果是这样的:如果找到了匹配的相关记录则返回0,如果没有找到匹配的相关记录则返回1,如果执行过程中出错,就返回2,你可以使用man grep查看相关说明,具体如下所示:

EXIT STATUS
       Normally  the  exit status is 0 if a line is selected, 1 if no lines were selected, and 2 if an error occurred.  However,
       if the -q or --quiet or --silent is used and a line is selected, the exit status is 0 even if an error occurred.

其实,grep命令在HP-UX下也是同样的返回值,如下所示:

 RETURN VALUE
      Upon completion, grep returns one of the following values:

 Hewlett-Packard Company            - 3 -       HP-UX 11i Version 3 Feb 2007

 grep(1)                                                             grep(1)

           0    One or more matches found.
           1    No match found.
           2    Syntax error or inaccessible file (even if matches were
                found).

所以,我的想法/认知是错误的,而前同事也是在shell脚本中借助grep这个特性和$?来判断Oracle实例是否处于OPEN状态。这个也是一个shell脚本中的一个技巧,只是我很少用这种技巧,另外,由于对grep命令返回的值不清楚(具体来说,不清楚grep没有匹配到相关记录时返回1)。因此闹了一个乌龙事件。