shell脚本regex正则表达式

时间：2009-06-24 来源：starby

.任意字符
^行首匹配
$行尾匹配
^$表示空行,不含字符的行
^ $匹配只有单个空格的行
[0-9]
[a-zA-Z]
^[A-Z]搜索以大写字母开头的行
[^A-Z]匹配大写字母意外的任意字符
*表示匹配0个或若干个字符，如:a*,表示匹配0个或若干个a; aa*表示匹配至少1个a
.*来表示0或若干个任意字符
e.e*表示匹配第一个e和最后一个e之间的任意字符
[-0-9]匹配一个连字符或数字
[]a-z]匹配一个]或者字母
\{min,max\}匹配任意数目的字符串
[a-z]\{10\}只匹配10个a-z字符的字符串
s/.\{5\}$// 删除每行的最后5个字符
$...$,n是1到9的数字,表示存储用的寄存器,用\n来引用存在寄存器中的内容
^$.$\1匹配行首的第一个字符,并将该字符存到1号寄存器中,然后匹配1号寄存器中的内容,这由\1的描述。该正则表达式的最终效果是,如果一行的头两个字符相同,就匹配他们。
^$.$.*\1$匹配一行中的头一个字符(^.)跟最后一个字符(\1$)相同的行。.*匹配中间的所有内容
^$...$$...$行中头三个字符存在1号寄存器,接着的三个字符存在2号寄存器.
s/$.*$ $.*$/\2 \1/g 交换两个字段

.任何字符
^行首
$行尾
*前导的正则表达式重复0或若干次
[字符表]字符中的任一字符
a..表示a后的2个字符
^wood表示行首的wood
x$表示行为的x
^INSERT$只包含字符串INSERT的行
^$不包含任何字符的行
x*表示0或若干个连续的x
xx*表示1或多个连续的x
.*表示0活若干个字符
w.*s表示以w开始,s结尾的任何字符串
[tT]小写或大写的t

[^字符表]表示任一不在字符表中的字符[^0-9] [^a-zA-Z]
\{min,max\}表示前导的正则表达式重复只烧min次,至多max次[0-9]\{3,9\}表示3到9个数字
$...$表示将小括号中匹配的字符串存储到下一个寄存器中(1-9),
^$.$表示行中第1个字符存到1号寄存器
^$.$\1表示行首恋歌字符,且他们相同

cut -c5 file把file文件中没行的第5个字符析取出来;
用逗号分割的数值列表,如-c1,13,50把第1,13,50个字符析取出来
cut -c20-50把第20到50之间的字符析取出来
如
who | cut -c1-8
who | cut -c1-8,18- 析取行中的第1到8个字符(用户名)和第18到行尾的字符(登录时间)

cut -ddchar -ffields file其中,dchar是数据中分割各字段的分割符,fields表示要从文件file中析取出来的字段.
字段编号从1开始,而且格式跟以前将的用来指定字符位置的数字一样(如-f1、2、8、-f1-3、-f4-)。
cut -d: -f1 /etc/passwd
如果已知字段之间使用制表符分隔的,就可以给cut命令用-f选项而不用-c选项,好多了！还记得吧,这里用不着用-d选项来指定分割符,因为
cut把制表符默认为分割符。

paste和cut正好相反,它不是把行分离开,而是把多行合并在一起。

paste names numbrs文件names中的每一行都和numbers中的对应行显示在一起,中间用制表符分割。
如果不想用制表符作默认分割,可以使用-dchars指定分割符
paste -d'+' names addresses numbers
-s选项告诉paste把同一文件中的行粘贴在一起,而不是从其他文件。如果只指定一个文件名,其效果是把文件中的所有行合并成一行,原来隔行之间用制表符或者有-d选项指定的分割符分割。

sed是用来编辑数据的程序,意指流编辑器(stream editor)。与ed不同,sed不能用于交互,
-n选项,然后使用p命令显式指定
sed -n '1,2p' file只显示前2行
sed -n '/Unix/p' file只打印包含Unix的行
删除行
d删除整行文件
sed '1,2d' file删除1和2行
记住sed默认把输入的所有行写入标准输出,所以生于行的文字,也就是从第3行到结尾,都被写入标准输出。
sed '5d'删除第5行
sed '/[Tt]est/d'删除包含test或Test的行
sed -n '20,25p' test只显示文件test的第20行到第25行
sed '1,10s/unix/UNIX/g' intro报intro前10行中的unix改为UNIX
sed '/jan/s/-1/-5/'将所有包含jan的行中第1个-1改为-5
sed 's/...//' data删除data文件每一行的前3个字符
sed 's/...$//' data删除data文件每一行的最后3个字符
sed -n 'I' text显示文件text的所有行,把所有不可打印字符显示为\nn,制表符显示为\t

过滤器tr用来转换来自标准输入的字符,tr命令的一般格式为
tr from-chars to-chars

tr e x < intro把所有字母e转换成x
tr命令的输入必须重定向到文件intro,因为tr总是从标准输入获得输入;转换的结果写入标准输出,而原始文件保持不变。
cut -d: -f1,6 /etc/passwd | tr : ' ' 通过在管道线的最后加上适当的tr命令,就可以把冒号转换成制表符,这样产生的输出更容易看
单引号中括的是制表符(尽管你看不到)。必须将它括在引号中,以便穿过shell,使tr有机会看到它。
使用\nnn来给tr提供8进制表示的字符
一些ascii字符的八进制值
响铃    7
退格    10
制表符 11
新行    12
换行    12
换页    14
回车    15
转义    33

date | tr ' ' '\12'此例中,tr接受date命令的输出,并把所有的空格转换成换行
tr '[a-z]' '[A-Z]' <intro将所有小写转换为大写
-s选项,tr命令中的-s选项用来压缩to-chars中重复的字符,换句话说,如果转换完成后,有to-chars中的某个字符连续出现多次,则这些连续相同的字符被替换为一个字符。
如下面的命令将冒号转换为制表符,并将多个连续制表符替换为单个制表符：
tr -s ':' '\11\'
tr -s ' ' ' ' <lotspaces通过-s将多个空格全部压缩为单个空格
-d选项用来删除掉输入流中的字符,其一般格式为
tr -d from-chars任何列在from-chars中的字符都会被从标准输入中删除。下例用tr来删除文件intro中的所有空格:
tr -d ' ' <intro
当然sed 's/ //g' intro也可以得到同样的效果

tr 'X' 'x'     把大X专成小x
tr '()' '{}'   把所有左小括号转换成左大括号,右小括号专成右大括号
tr '[a-z]' '[A-Z]' 把小写转大写
tr '[A-Z]' '[N-ZA-M]' 把A-M字母分别专成N-Z把N-Z转成A-M
tr '    ' ''把所有制表符转换成空格
tr -s ' ' ''把多个空格转换成单个空格
tr -d '\14' 删除所有换页字符(八进制14)
tr -d '[0-9]'删除所有数字

grep '[A-Z]' list list中包含一个大写字母的行
grep '[0-9]' data中包含数字的行
grep '[A-Z]...[0-9]' list list中包含以大写字母开始、数字结尾的5个字符组合的行
grep '\.pic$' filelist filelist中以.pic结尾的行

uniq in_file out_file该格式中,uniq把in_file复制到out_file,处理过程中,去掉其中的重复行。如果不指定第2个参数out_file,结果就写入标准输出；如果in_file没有指定,那么uniq就成了一个过滤器,从标准输入读取输入。

>或<    重定向,覆盖原有的内容
>>或<< 重定向,想文件末尾追加内容
tee     显示在终端上的内容存储到文件 ls | tee >glx

-d 目录
-e 存在
-f 普通文件
-r 进程可读文件
-s 长度不为0
-w 进程可写文件
-x 可执行
-L 链接文件

$# 传给程序的参数个数,或者执行set命令设置的参数个数
$* 对位置参数等的集中引用
$@ 跟$*相似,区别在于当加入双引号后("$@"),集中引用位置参数"$1","$2"...等
$0 正执行的程序名
$$ 正执行程序的进程id
$! 最后一个发生后台运行的程序的进程id
$? 最后一个在前台执行的程序的退出状态
$- 当前有效选项标志

`command`符号之间的内容为需要执行的命令
make -C /lib/modules/`uname -r`/build M=`pwd`

使用echo可以显示字符串,但是不能格式化字符串,可以使用printf实现
printf "format" arg1 arg2 ...

ln -s from to 把from链接到to上,所以to是from的符号链接

tree -d只显示目录
tree -L 2显示2级目录

字符串比较
s1 = s2    s1等于s2
s1 != s2    s1不等于s2
s1          s1不为空
-n s1       s1不为空
-z s1       s1为空
整数比较操作
-eq 等于
-ge 大于或等于
-gt 大于
-le 小于或等于
-lt 小于
-ne 不等于

[ "$x1" = 5 ]字符串比较
[ "$x1" -eq 5 ]整数比较

-a 逻辑与操作
-o 逻辑或操作

command1 && command2
则先执行command1,如果返回的退出状态为0,则执行command2;如果command1返回的退出状态非0,则跳过command2

command1 || command2
和上边的&&差不多,只是,仅仅当command1返回非0时,才执行command2

#!/bin/sh
append2=0
include_lib=1

if [ -f cscope_i ];then
    rm cscope_i
fi

for cscope_file in $*; do
if [ -f "$cscope_file" ] || [ -d "$cscope_file" ];then
#   if [ $cscope_file = '-a' ];then
#    append2=1
#    continue
#   fi
#
#   if [ $cscope_file = '-n' ];then
#    include_lib=0<F11>
#    continue
#   fi
   if [ "$append2" = "1" ];then
    find $cscope_file -maxdepth 1 -name '*.[cChH]' -o -name '*.[cC][pP][pP]'>>cscope_i
   else
    find $cscope_file -name '*.[cChH]' -o -name '*.[cC][pP][pP]'>>cscope_i
   fi
else
   if [ $cscope_file = '-a' ];then
    append2=1
   elif [ $cscope_file = '-n' ];then
    include_lib=0
   else
    echo "Error: cannot read file $cscope_file"
   fi
fi
done

if [ -f cscope_i ];then
    if [ "$include_lib" = "1" ];then
        cscope -bi cscope_i
    else
        cscope -bki cscope_i
    fi
    rm cscope_i
fi