sed 学习笔记
时间:2005-03-25 来源:li2002
sed 学习笔记(与大家共勉) admirer
声明:这些代码只是为了学习和理解sed命令而为之,并不代表问题的唯一解或最佳解,希望各位拍砖
参考资料:<sed&awk.pdf>等
一. 替换
1.神奇变换(y命令的使用)
测试
将文件中1换成A
将文件中2换成B
...
将文件中0换成J
注意变换关系是按两个list的位置对应变换,y是一个管局命令,拒绝使用后缀flag/g
list1:1234567890
list2:ABCDEFGHIJ
下面再作一个与前例相反的变换
2.替换每行第一个匹配
举例:
3.替换每行第n(如果有的话)个匹配
4.替换每行所有匹配
二.行号处理
1.为文件加行号
举例
2.仅为文件中的正文行加行号
举例
三.字串翻转
举例
四.选择性输出
1.打印文档奇数行(隔行输出)
2.打印偶数行(隔行输出)
3.删除连续重复行(大量使用了pattern space 文件太大时要注意)
举例
4.合并上下行并以空格相分隔
举例
5.将以符号结尾的行与下行合并并以空格分隔(拼接断行)
举例
6.按关键字拼接行
如果某行以=开始,则合并到上一行并替代=为空格
举例
7.输出匹配行的下一行
举例
8.显示匹配行的行号并输出匹配行的上行、匹配行、下行
sed -n -e '/regexpr/{=;x;1!p;g;$!N;p;D;}' -e h
举例
9.删除文档中某标志区域内的关键字匹配行
删除文档中从being开到end结束的块中包含myword的行
测试
五.字串解析
1.从字串中解析出两个子串(前2各字符和后9个字符)
2.分解日期串
先说说b吧:
比如有文件如下:
先要求将其中的"5"替换成" 伍十万 ",但当该行包含字母"a"时,"5"就要替换成" 叁佰万 ".
现看如何通过b来实现:
测试:
当然,这只是为了说明sed中b的用法,不带表此类问题的最佳解决途径.
声明:这些代码只是为了学习和理解sed命令而为之,并不代表问题的唯一解或最佳解,希望各位拍砖
参考资料:<sed&awk.pdf>等
一. 替换
1.神奇变换(y命令的使用)
代码: |
sed 'y/ori_letter_list/target_letter_list/' filename |
代码: |
cat filename 1234567890 2345678901 3456789012 4567890123 |
将文件中1换成A
将文件中2换成B
...
将文件中0换成J
代码: |
sed 'y/1234567890/ABCDEFGHIJ/' filename ABCDEFGHIJ BCDEFGHIJA CDEFGHIJAB DEFGHIJABC |
list1:1234567890
list2:ABCDEFGHIJ
下面再作一个与前例相反的变换
代码: |
sed 'y/0987654321/ABCDEFGHIJ/' filename JIHGFEDCBA IHGFEDCBAJ HGFEDCBAJI GFEDCBAJIH |
2.替换每行第一个匹配
代码: |
sed 's/regexpr/anyword/' filename sed 's/regexpr/anyword/1' filename |
举例:
引用: |
cat filename 1234567890 2345678901 3456789012 4567890123 sed 's/5/五/' filename 1234五67890 2345678901 34五6789012 4567890123 |
3.替换每行第n(如果有的话)个匹配
代码: |
sed "s/regexpr/anyword/${n}" filename cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 举例 sed "s/4/ 四 /8" filename 111111111111111111 222222222222222222 333333333333333333 4444444 四 4444444444 |
4.替换每行所有匹配
代码: |
cat filename 1234567890 2345678901 3456789012 4567890123 |
代码: |
举例: sed 's/3/三/g' filename 12三4567890 2三45678901 三456789012 456789012三 |
二.行号处理
1.为文件加行号
代码: |
sed = filename|sed 'N;s/ /:/' cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 |
举例
代码: |
sed = filename|sed 'N;s/ /:/' filename 1:111111111111111111 2:222222222222222222 3:333333333333333333 4:444444444444444444 |
2.仅为文件中的正文行加行号
代码: |
sed /./= a|sed '/./N;s/ /:/' |
举例
代码: |
cat filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 sed /./= a|sed '/./N;s/ /:/' filename 1:111111111111111111 3:222222222222222222 4:333333333333333333 6:444444444444444444 |
三.字串翻转
代码: |
sed '/ /!G;s/(.)(.* )/&21/;//D;s/.//' |
举例
代码: |
echo 1234567890|sed '/ /!G;s/(.)(.* )/&21/;//D;s/.//' 0987654321 |
四.选择性输出
1.打印文档奇数行(隔行输出)
代码: |
sed 'n;d' sed 'x;$!N;x' sed -n 'p;n' 1 3 5 7 |
2.打印偶数行(隔行输出)
代码: |
sed -n 'n;p' sed '1d;n;d;' 2 4 6 8 |
3.删除连续重复行(大量使用了pattern space 文件太大时要注意)
代码: |
sed '$!N; /^(.*) 1$/!P; D' #使用 $!N 要当心内存溢出 |
举例
代码: |
cat file 111111111111111111 222222222222222222 222222222222222222 333333333333333333 444444444444444444 444444444444444444 444444444444444444 444444444444444444 444444444444444444 sed '$!N; /^(.*) 1$/!P; D' filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 |
4.合并上下行并以空格相分隔
代码: |
sed '$!N;s/ / /' |
举例
代码: |
cat file 1234567890 0987654321 执行命令后 1234567890 0987654321 |
5.将以符号结尾的行与下行合并并以空格分隔(拼接断行)
代码: |
sed -e :a -e '/\$/N; s/\ / /; ta' |
举例
代码: |
cat filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 sed -e :a -e '/\$/N; s/\ / /; ta' filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 |
6.按关键字拼接行
如果某行以=开始,则合并到上一行并替代=为空格
代码: |
sed -e :a -e '$!N;s/ =/ /;ta' -e 'P;D' |
举例
代码: |
cat file 111111111111111111 222222222222222222 =333333333333333333 444444444444444444 sed -e :a -e '$!N;s/ =/ /;ta' -e 'P;D' filename 111111111111111111 222222222222222222 333333333333333333 444444444444444444 |
7.输出匹配行的下一行
代码: |
sed -n '/regexpr/{n;p;}' filename |
举例
代码: |
cat filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 sed -n '/^3/{n;p;}' filename 4 444444444444444444 |
8.显示匹配行的行号并输出匹配行的上行、匹配行、下行
sed -n -e '/regexpr/{=;x;1!p;g;$!N;p;D;}' -e h
举例
代码: |
cat filename 1 111111111111111111 2 222222222222222222 3 333333333333333333 4 444444444444444444 sed -n -e '/^3/{=;x;1!p;g;$!N;p;D;}' -e h filename 3 #匹配行的行号 2 222222222222222222 #上一行 3 333333333333333333 #匹配行 4 444444444444444444 #下一行 |
9.删除文档中某标志区域内的关键字匹配行
删除文档中从being开到end结束的块中包含myword的行
代码: |
sed '/^begin/,/^end/{/myword/d;}' filename |
引用: |
cat filename myword begin myword Number! myword Number! myword Number! myword Number! end myword Number! |
引用: |
myword begin Number! Number! Number! Number! end myword Number! |
五.字串解析
1.从字串中解析出两个子串(前2各字符和后9个字符)
代码: |
echo "WeLoveChinaUnix"|sed -e 'H;s/(..).*/1/;x;s/.*(.{9})$/1/;x;G;s/ / /' We ChinaUnix |
2.分解日期串
代码: |
echo 20030922|sed 's/(....)(..)(..)/1 2 3/'|read year month day echo $year $month $day 2003 09 22 |
binary 写到: |
好文! 希望斑竹进一步解释一下 label 以及相关的 t 和 b 的用法 |
先说说b吧:
比如有文件如下:
代码: |
cat filename a1234567890 1234567890 1234567890a 1234567890 123456a7890 |
先要求将其中的"5"替换成" 伍十万 ",但当该行包含字母"a"时,"5"就要替换成" 叁佰万 ".
现看如何通过b来实现:
引用: |
cat filename.sed #!/bin/sed -f /a/b 5t #如果当前行包含字母"a"则转到label"5t"处 s/5/ 五十万 /g #将5替换成" 五十万 " b #未指明跳转位置时,跳到Script的尾部 :5t #设置名称为"5t"的label s/5/ 叁佰万 /g #提换5为" 叁佰万 " |
引用: |
sed -f filename.sed filename 1234 五十万 67890 a1234 叁佰万 67890 1234 五十万 67890 1234 叁佰万 67890a 1234 五十万 67890 1234 叁佰万 6a7890 |
当然,这只是为了说明sed中b的用法,不带表此类问题的最佳解决途径.
相关阅读 更多 +