简洁的bash编程技巧

jopen 12年前

下面这几条是我自己在写shell代码的时候,比较喜欢的几种写法,抛砖引玉。
1) 检查命令执行是否成功
第一种写法,比较常见:

echo abcdee | grep -q abcd   if [ $? -eq 0 ]; then      echo "Found"  else      echo "Not found"  fi
简洁的写法:
if echo abcdee | grep -q abc; then      echo "Found"  else      echo "Not found"  fi

当然你也可以不要if/else,不过这样可读性比较差:
[Sun Nov 04 05:58 AM] [kodango@devops] ~/workspace   $ echo abcdee | grep -q abc && echo "Found" || echo "Not found"  Found

2) 将标准输出与标准错误输出重定向到/dev/null
第一种写法,比较常见:
grep "abc" test.txt 1>/dev/null 2>&1
常见的错误写法:
grep "abc" test.txt 2>&1 1>/dev/null
简洁的写法:
grep "abc" test.txt &> /dev/null
3) awk的使用
举一个实际的例子,获取Xen DomU的id。
常见的写法:
sudo xm li | grep vm_name | awk '{print $2}'
简洁的写法:
sudo xm li | awk '/vm_name/{print $2}'
4) 将一个文本的所有行用逗号连接起来
假设文件内容如下所示:
[Sat Nov 03 10:04 PM] [kodango@devops] ~/workspace 
$ cat /tmp/test.txt 
1
2
3
使用Sed命令:
[Sat Nov 03 10:14 PM] [kodango@devops] ~/workspace 
$ sed ':a;$!N;s/\n/,/;ta' /tmp/test.txt 
1,2,3
简洁的写法:
[Sat Nov 03 10:04 PM] [kodango@devops] ~/workspace 
$ paste -sd, /tmp/test.txt 
1,2,3
5) 过滤重复行
假设文件内容如下所示:
[Sat Nov 03 10:16 PM] [kodango@devops] ~/workspace 
$ sort /tmp/test.txt 
1
1
2
3
常用的方法:
[Sat Nov 03 10:16 PM] [kodango@devops] ~/workspace 
$ sort /tmp/test.txt | uniq
1
2
3
简单的写法:
[Sat Nov 03 10:16 PM] [kodango@devops] ~/workspace 
$ sort /tmp/test.txt -u
1
2
3
6) grep查找单词
假设一个文本的每一行是一个ip地址,例如
[Sat Nov 03 10:20 PM] [kodango@devops] ~/workspace 
$ cat /tmp/ip.list 
10.0.0.1
10.0.0.12
10.0.0.123
使用grep查找是否包括10.0.0.1这个ip地址。常见的写法:
[Sat Nov 03 10:22 PM] [kodango@devops] ~/workspace 
$ grep '10.0.0.1\>' /tmp/ip.list 
10.0.0.1
简单的方法(其实这方法不见得简单,只是为了说明-w这个参数还是很有用的)
[Sat Nov 03 10:23 PM] [kodango@devops] ~/workspace 
$ grep -w '10.0.0.1' /tmp/ip.list 
10.0.0.1
顺便grep的-n/-H/-v/-f/-c这几参数都很有用。
7) 临时设置环境变量
常见的写法:
[Sat Nov 03 10:26 PM] [kodango@devops] ~/workspace 
$ export LC_ALL=zh_CN.UTF-8 
 
[六 11月 03 10:26 下午] [kodango@devops] ~/workspace 
$ date
2012年 11月 03日 星期六 22:26:55 CST
简洁的写法:
[六 11月 03 10:26 下午] [kodango@devops] ~/workspace 
$ unset LC_ALL
 
[Sat Nov 03 10:27 PM] [kodango@devops] ~/workspace 
$ LC_ALL=zh_CN.UTF-8 date 
2012年 11月 03日 星期六 22:27:43 CST
在命令之前加上环境变更的设置,只是临时改变当前执行命令的环境。
8) $1,$2…等位置参数的使用
假设只想使用$2,$3..这几个参数,常见的做法是:
shift
echo "$@"
为什么不这样写呢?
echo "${@:2}"
9)退而求其次的写法
相信大家会有这种需求,当一个参数值没有提供时,可以使用默认值。常见的写法是:
arg=$1
 
if [ -z "$arg" ]; then
   arg=0
fi
简洁的写法是这样的:
arg=${1:-0}
10)bash特殊参数–的用法
假设要用grep查找字符串中是否包含-i,我们会这样尝试:
[Sat Nov 03 10:45 PM] [kodango@devops] ~/workspace 
$ echo 'abc-i' | grep "-i"
Usage: grep [OPTION]... PATTERN [FILE]...
Try 'grep --help' for more information.
 
[Sat Nov 03 10:45 PM] [kodango@devops] ~/workspace 
$ echo 'abc-i' | grep "\-i"
abc-i
简洁的方法是:
[Sat Nov 03 10:45 PM] [kodango@devops] ~/workspace 
$ echo 'abc-i' | grep -- -i
abc-i
bash中–后面的参数不会被当作选项解析。
11)函数的返回值默认是最后一行语句的返回值
# Check whether an item is a function
# $1: the function name
# Return: 0(yes) or 1(no)
function is_function()
{
    local func_name=$1
    test "`type -t $1 2>/dev/null`" = "function"
}
不要画蛇添足再在后面加一行return $?了。
12) 将printf格式化的结果赋值给变量
例如将数字转换成其十六进制形式,常见的写法是:
[Sat Nov 03 10:55 PM] [kodango@devops] ~/workspace 
$ var=$(printf '%%%02x' 111)
简单的写法是:
[Sat Nov 03 10:54 PM] [kodango@devops] ~/workspace 
$ printf -v var '%%%02x' 111
看看printf的help
[Sat Nov 03 10:53 PM] [kodango@devops] ~/workspace 
$ help printf | grep -A 1 -B 1 -- -v
printf: printf [-v var] format [arguments]
    Formats and prints ARGUMENTS under control of the FORMAT.
--
    Options:
      -v var assign the output to shell variable VAR rather than
    display it on the standard output
13)打印文件行
打印文件的第一行:
head -1 test.txt
打印文件的第2行:
sed -n '2p' test.txt
打印文件的第2到5行:
sed -n '2,5p' test.txt
打印文件的第2行始(包括第2行在内)5行的内容:
sed -n '2,+4p' test.txt
打印倒数第二行:
$ tail -2 test.txt | head -1
$ tac test.txt | sed -n '2p'
14)善用let或者(())命令做算术运算
如何对一个数字做++运算,可能你会这样用:
a=1
a=`expr a + 1`
为何不用你熟悉的:
a=1
let a++
let a+=2
15)获取软连接指定的真实文件名
如果你不知道,你可能会这样获取:
[Sat Nov 03 11:12 PM] [kodango@devops] ~/workspace 
$ ls -l /usr/bin/python | awk -F'->' '{print $2}' | tr -d ' '
/usr/bin/python2
如果你知道有一个叫readlink的命令,那么:
[Sat Nov 03 11:13 PM] [kodango@devops] ~/workspace 
$ readlink /usr/bin/python
/usr/bin/python2
16)获取一个字符的ASCII码
[Sat Nov 03 11:14 PM] [kodango@devops] ~/workspace 
$ printf '%02x' "'+"
2b
[Sat Nov 03 11:30 PM] [kodango@devops] ~/workspace 
$ echo -n '+' | od -tx1 -An | tr -d ' '
2b
17)清空一个文件
常见的用法:
echo "" > test.txt
简单的写法:
> test.txt
18) 不要忘记有here document
下面一段代码:
grep -v 1 /tmp/test.txt | while read line; do
    let a++
    echo --$line--
done
 
echo a:$a
执行后有什么问题吗?
[Sun Nov 04 05:35 AM] [kodango@devops] ~/workspace 
$ sh test.sh 
--2--
--3--
a:
发现a这个变量没有被赋值,为什么呢?因为管道后面的代码是在在一个子shell中执行的,所做的任何更改都不会对当前shell有影响,自然a这个变量就不会有赋值了。
换一种思路,可以这样做:
grep -v 1 /tmp/test.txt > /tmp/test.tmp
 
while read line; do
    let a++
    echo --$line--
done < /tmp/test.tmp
 
echo a:$a
rm -f /tmp/test.tmp
不过多了一个临时文件,最后还要删除。这里其实可以用到here document:
b=1
while read line2; do
    let b++
    echo ??$line2??
done < < EOF
`grep -v 1 /tmp/test.txt`
EOF
 
echo b: $b
here document往往用于需要输出一大段文本的地方,例如脚本的help函数。
19)删除字符串中的第一个或者最后一个字符
假设字符串为:
[Sun Nov 04 10:21 AM] [kodango@devops] ~/workspace 
$ str="aremoveb"
可能你第一个想法是通过sed或者其它命令来完成这个功能,但是其实有很简单的方法:
[Sun Nov 04 10:24 AM] [kodango@devops] ~/workspace 
$ echo "${str#?}"
removeb
 
[Sun Nov 04 10:24 AM] [kodango@devops] ~/workspace 
$ echo "${str%?}"
aremove
类似地,你也可以删除2个、3个、4个……
有没有一次性删除第一个和最后一个字符的方法呢?答案当然是肯定的:
[Sun Nov 04 10:26 AM] [kodango@devops] ~/workspace 
$ echo "${str:1:-1}"
remove
关于这些变量替换的内容在bash的man手册中都有说明。
20)使用逗号join数组元素
假设数组元素没有空格,可以用这种方法:
[Sun Nov 04 10:14 AM] [kodango@devops] ~/workspace 
$ a=(1 2 3) 
$ b="${a[*]}"
 
[Sun Nov 04 10:15 AM] [kodango@devops] ~/workspace 
$ echo ${b// /,}
1,2,3
注意:当该数组的长度非常长时,使用这种替换的时间开销很高,性能很差,推荐用sed。
假设数组元素包含有空格,可以借用printf命令来达到:
[Sun Nov 04 10:15 AM] [kodango@devops] ~/workspace 
$ a=(1 "2 3" 4)
 
[Sun Nov 04 10:15 AM] [kodango@devops] ~/workspace 
$ printf ",%s" "${a[@]}" | cut -c2-   
1,2 3,4
21) Shell中的多进程
在命令行下,我们会在命令行后面加上&符号来让该命令在后台执行,在shell脚本中,使用"(cmd)"可以让fork一个子shell来执行该命令。利用这两点,可以实现shell的多线程:
job_num=10
 
function do_work()
{
    echo "Do work.."
}
 
for ((i=0; i<job_num ;i++)); do
    echo "Fork job $i"
    (do_work) &
done
 
wait   # wait for all job done
echo "All job have been done!"
注意最后的wait命令,作用是等待所有子进程结束。
附几则小技巧:
1)sudo iptables -L -n | vim -
2)grep -v xxx | vim -
3)echo $'\''
4)set -- 1 2 3; echo "$@"
5)搜索stackoverflow/superuser等站点


——————————————————————————


(续)
上一篇文章发表后反响还是不错的,让我这个博客热闹了不少,以后我会陆陆续续将自己学到的一些新的技巧更新在这篇续篇中,当然也希望其它同学也能一起分享你们的技巧。续篇中有部分的内容已经偏离bash编程了,而是命令行下的技巧,题目我暂时不改,请见谅。
1) bash中alias的使用
alias其实是给常用的命令定一个别名,比如很多人会定义一下的一个别名:
alias ll='ls -l'
以后就可以使用ll,实际展开后执行的是ls -l。
现在很多发行版都会带几个默认的别名,比如:
alias grep='grep --color=auto'  # 带颜色显示
alias ls='ls --color=auto' # 同上
alias rm='rm -i'  # 删除文件需要确认
alias在某些方面确实提高了很大的效率,但是也是有隐患的,这点可以看我以前的一篇文章终端下肉眼看不见的东西。那么如何不要展开alias,而是用本来的意思呢?答案是使用转义:
\ls
\grep
在命令前面加一个反斜杠后就可以了。
这里要插一段故事,前两天我在shell脚本中定义了下面的一个alias,假设位于文件util.sh:
#!/bin/bash
...
alias ssh='ssh -o StrictHostKeyChecking=no -o LogLevel=quiet -o BatchMode=yes'
...
后面这串ssh选项是为了去掉一些warning的信息,不提示输入密码等等。具体可以看ssh的文档说明。我自己测试的时候好好的,当时我同事跑得时候却依然有报Warning。我对比了下我们两个人的用法:
sh util.sh  # 我的
./util.sh   # 他的
大家应该知道,直接./util.sh执行,shell会去找脚本第一行的shebang中给定的解释器去执行改脚本,所以第二种用法相当于直接用bash来执行。那想必是bash/sh对alias是否默认展开这一点上是有区别的了(可能是bash版本的问题,RHEL 5U4)。翻阅了下Bash的man手册,发现可以通过设置expand_aliases选项来打开alias展开的功能,默认在非交互式Shell下是关闭的(什么是交互式登录Shell)。
修改下util.sh,打开这个选项就Ok了:
#!/bin/bash
...
# Expand aliases in script
shopt -s expand_aliases
alias ssh='ssh -o StrictHostKeyChecking=no -o LogLevel=quiet -o BatchMode=yes'
...
2)awk打印除第一列之外的其他列
awk用来截取输入行中的某几列很有用,当时如果要排除某几列呢?
例如有如下的一个文件:
$ cat /tmp/test.txt
1 2 3 4 5
10 20 30 40 50
可以用下面的代码解决(来源):
$ awk '{$1="";print $0}' /tmp/test.txt
 2 3 4 5
 20 30 40 50
但是前面多了一个空格,可以用cut命令稍微调整下:
$ awk '{$1="";print $0}' /tmp/test.txt | cut -c2-
2 3 4 5
20 30 40 50
3)巧用bash的命令展开功能备份文件
假设要备份文件/your/path/to/file.list为/your/path/to/file.list.20121106,常规的方法是:
cp /your/path/to/file.list /your/path/to/file.list.20121106
这样重复写上一长串的路径,是不是很麻烦,这里利用bash的展开特性可以这样做:
cp /your/path/to/file.list{,.20121106}
/your/path/to/file.list{,.20121106}这一部分会展开为/your/path/to/file.list /your/path/to/file.list.20121106,再将此传给cp命令,就达到了与前面同样的效果。(思路同ls *)。具体可以man bash中的Brace Expansion这一段。
4)命令行下使用ctrl+x ctrl+e来编辑当前命令。
这个技巧来自最牛B的 Linux Shell 命令系列连载(二)。使用方法是键入命令之后,再按ctrl+x ctrl+e可以打开一个编辑器来编辑命令,默认是使用emacs。你也可以通过在~/.bashrc中添加以下这一行,将编辑器换成vim:
export EDITOR='vim'
为什么推荐这一条呢?对于一般的命令(这里指的是长度很短的命令)其实这个技巧没什么用处,我用方向键移一下就OK了,但是有时候(尤其是运维的一些命令)有些命令长度特别长,一堆参数,如果直接在命令行修改其实风险很高的(可以通过在命令的开头加上一个#号来规避这个风险,Bash将当前的命令当成注释不执行),而且方向键一个一个迁移非常不方便(当然有类似ctrl+x ctrl+e这种预设的快捷键来操作,可以看bind -p)。
像使用ctrl+x,ctrl+e打开vim来编辑命令在这种场景有两种好处:
1. 可以方便的用熟悉的编辑器高效地修改命令;
2. 有一个确认的过程,无误后,退出vim才执行命令。
不过我不是很推荐最牛B的 Linux Shell 命令 系列连载中的一些对历史命令的技巧,虽然方便,但是风险很高,因为没有一个确认的过程,是执行将历史命令调出就执行了。
5)你知道sed的这个特性吗?
假设一个文件的每一行为一个路径:
[Tue Nov 06 06:33 PM] [kodango@devops] ~ 
$ cat /tmp/test.txt
/home/kodango/hello
/home/kodango/hello/world
/home/kodango/good
/home/kodango/good/bye
现在要把/home/kodango/good替换成/home/kodango/bad,普通的作法是:
[Tue Nov 06 06:35 PM] [kodango@devops] ~ 
$ sed -n 's/\/home\/kodango\/good/\/home\/kodango\/bye/p' /tmp/test.txt 
/home/kodango/bye
/home/kodango/bye/bye
因为路径中的分隔符与sed的替换命令的分隔符都是’/',所以需要转义,非常麻烦。幸运的是,sed可以更改分隔符,例如使用#:
[Tue Nov 06 06:34 PM] [kodango@devops] ~ 
$ sed -n 's#/home/kodango/good#/home/kodango/bad#p' /tmp/test.txt 
/home/kodango/bad
/home/kodango/bad/bye
这样就清爽多了。

from:

http://kodango.me/simple-bash-programming-skills

http://kodango.me/simple-bash-programming-skills-2