sed很强大的文本操作命令

张映 发表于 2010-08-24

分类目录: shell

标签:, , ,

sed对文本的处理很强大,并且sed非常小,参数少,容易掌握,他的操作方式根awk有点像。sed按顺序逐行读取文件。然后,它执行为该行指定的所有操作,并在完成请求的修改之后的内容显示出来,也可以存放到文件中。完成了一行上的所有操作之后,它读取文件的下一行,然后重复该过程直到它完成该文件。在这里要注意一点,源文件(默认地)保持不被修改。sed 默认读取整个文件并对其中的每一行进行修改。说白了就是一行一行的操作。我用sed主要就是用里面的替换功能,真的很强大。下面以实例,详细的说一下,先从替换开始,最常用的。

一,测试文件test,讲awk时用的一样

sed -h
-n, --quiet, --silent    取消自动打印模式空间
 -e 脚本, --expression=脚本   添加“脚本”到程序的运行列表
 -f 脚本文件, --file=脚本文件  添加“脚本文件”到程序的运行列表
 --follow-symlinks    直接修改文件时跟随软链接
 -i[扩展名], --in-place[=扩展名]    直接修改文件(如果指定扩展名就备份文件)
 -l N, --line-length=N   指定“l”命令的换行期望长度
 --posix  关闭所有 GNU 扩展
 -r, --regexp-extended  在脚本中使用扩展正则表达式
 -s, --separate  将输入文件视为各个独立的文件而不是一个长的连续输入
 -u, --unbuffered  从输入文件读取最少的数据,更频繁的刷新输出
 --help     打印帮助并退出
 --version  输出版本信息并退出

//下面test文件的内容
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/bin/false
daemon:x:2:2:daemon:/sbin:/bin/false
mail:x:8:12:mail:/var/spool/mail:/bin/false
ftp:x:14:11:ftp:/home/ftp:/bin/false
&nobody:$:99:99:nobody:/:/bin/false
zhangy:x:1000:100:,,,:/home/zhangy:/bin/bash
http:x:33:33::/srv/http:/bin/false
dbus:x:81:81:System message bus:/:/bin/false
hal:x:82:82:HAL daemon:/:/bin/false
mysql:x:89:89::/var/lib/mysql:/bin/false
aaa:x:1001:1001::/home/aaa:/bin/bash
ba:x:1002:1002::/home/zhangy:/bin/bash
test:x:1003:1003::/home/test:/bin/bash
@zhangying:*:1004:1004::/home/test:/bin/bash
policykit:x:102:1005:Po

二,举例

1,替换功能

[zhangy@BlackGhost mytest]# sed 's/root/tankzhang/' test |grep tank
 tankzhang:x:0:0:root:/root:/bin/bash

上面的这个例子,把test文件中的root替换成tankzhang,只不过只替换一次及终止在这一行的操作,转到下一行

[zhangy@BlackGhost mytest]# sed 's/root/tankzhang/g' test |grep zhang
 tankzhang:x:0:0:tankzhang:/tankzhang:/bin/bash
 zhangy:x:1000:100:,,,:/home/zhangy:/bin/bash
 ba:x:1002:1002::/home/zhangy:/bin/bash
 @zhangying:*:1004:1004::/home/test:/bin/bash

上面这个例子,用tankzhang把文件test中的root全部替换掉,请注意g这个字母,global的缩写

[zhangy@BlackGhost mytest]# sed -n 's/root/tankzhang/p' test
 tankzhang:x:0:0:root:/root:/bin/bash

加了-n p后表示只打印那些发生替换的行(部分替换),上面的例子,我并没有加上grep

[zhangy@BlackGhost mytest]# sed -n 's/root/tankzhang/pg' test
 tankzhang:x:0:0:tankzhang:/tankzhang:/bin/bash

加了-n pg后表示只打印那些发生替换的行(全部替换),上面的例子,我并没有加上grep

[zhangy@BlackGhost mytest]# cat test | sed -ne '2,8s/^zhang/ying/gp'
 yingy:x:1000:100:,,,:/home/zhangy:/bin/bash

在第二行,到第八行之间,替换以zhang开头的行,用ying来替换,并显示替换的行

[zhangy@BlackGhost mytest]# cat test | sed -n  '2,8s/^zhang/ying/gp;5,10s#dbus#goodbay#gp'
 yingy:x:1000:100:,,,:/home/zhangy:/bin/bash
 goodbay:x:81:81:System message bus:/:/bin/false

当有多个命令要执行时,可以用分号来分开,并且分隔符可以自定义,默认是/。上面的例子意思是在第二行,到第八行之间,替换以zhang开头的行,用ying来替换,在5,到10间,用goodbay来替换dbus,并显示替换的行

[zhangy@BlackGhost mytest]# cat test | sed -ne '2,8s/zhang/ying/gp' -ne  '5,10s#dbus#goodbay#gp'

yingy:x:1000:100:,,,:/home/yingy:/bin/bash
 goodbay:x:81:81:System message bus:/:/bin/false

这个例子根上面的那个例子一样,只不过有一点不同,那就是-e来充当了分号的作用,-e也能分割多个命令。

[zhangy@BlackGhost mytest]# sed -ne '2,8s/^\(zhangy\)/\1ing/gp' test
 zhangying:x:1000:100:,,,:/home/zhangy:/bin/bash

正则的用法,在sed里面用括号的话要加上\的,不然会报错的。

[zhangy@BlackGhost mytest]# sed -ne '2,15s/zhang/&ying/gp' test
 zhangyingy:x:1000:100:,,,:/home/zhangyingy:/bin/bash
 ba:x:1002:1002::/home/zhangyingy:/bin/bash
 @zhangyingying:*:1004:1004::/home/test:/bin/bash

&的用处是,在找到的字符串后加上&后面的字符串,zhang后都加上了ying

[zhangy@BlackGhost mytest]# sed -ne '/^zhang/,/Po/s/zhang/ying/gp' test
 yingy:x:1000:100:,,,:/home/yingy:/bin/bash
 ba:x:1002:1002::/home/yingy:/bin/bash
 @yingying:*:1004:1004::/home/test:/bin/bash

上面的这个例子是说,在以zhang开头的行开始,到匹配Po的行结束,在他们之间进行替换

[zhangy@BlackGhost mytest]$ sed  '/root/{n;s/bin/tank/}' test
 root:x:0:0:root:/root:/bin/bash
 tank:x:1:1:bin:/bin:/bin/false

n;这里的n是next的缩写,找到root的行后,将其下一行的中的bin换成tank

[zhangy@BlackGhost mytest]$ sed -e '1,2y/root/ROOT/' test
 ROOT:x:0:0:ROOT:/ROOT:/bin/bash
 bin:x:1:1:bin:/bin:/bin/false

y的作用是将匹配的字符换成大写,不过替换字符和被替换字符长度要一样

[zhangy@BlackGhost mytest]$ sed -e '/root/h' -e '$G' test

................................

.............................

ba:x:1002:1002::/home/zhangy:/bin/bash
 test:x:1003:1003::/home/test:/bin/bash
 @zhangying:*:1004:1004::/home/test:/bin/bash

root:x:0:0:root:/root:/bin/bash

这个例子中,h的作用是将找到的行,放到一个缓存区,G的作用是将缓存区中的内容放到最后一行。

[zhangy@BlackGhost mytest]$ sed -e '/root/h' -e '/zhangy/g' test
 root:x:0:0:root:/root:/bin/bash
 bin:x:1:1:bin:/bin:/bin/false
 daemon:x:2:2:daemon:/sbin:/bin/false
 mail:x:8:12:mail:/var/spool/mail:/bin/false
 ftp:x:14:11:ftp:/home/ftp:/bin/false
 &nobody:$:99:99:nobody:/:/bin/false
 root:x:0:0:root:/root:/bin/bash
 http:x:33:33::/srv/http:/bin/false
 dbus:x:81:81:System message bus:/:/bin/false
 hal:x:82:82:HAL daemon:/:/bin/false
 mysql:x:89:89::/var/lib/mysql:/bin/false
 aaa:x:1001:1001::/home/aaa:/bin/bash
 root:x:0:0:root:/root:/bin/bash
 test:x:1003:1003::/home/test:/bin/bash
 root:x:0:0:root:/root:/bin/bash

行替换,用匹配root的行,来替换匹配zhangy的行

[zhangy@BlackGhost mytest]$ sed -e 's/bin/tank/g;3q' test
 root:x:0:0:root:/root:/tank/bash
 tank:x:1:1:tank:/tank:/tank/false
 daemon:x:2:2:daemon:/stank:/tank/false

3q的意思是到第三行的时候,退出

[zhangy@BlackGhost mytest]# sed -ne '2,15s/zhangy.*[[:digit:]]/=======/gp'  test
 =======:,,,:/home/zhangy:/bin/bash
 @=======::/home/test:/bin/bash

匹配数字别忘了中括号外面还有一个中括号。

[:alnum:] 字母数字 [a-z A-Z 0-9]
[:alpha:] 字母 [a-z A-Z]
[:blank:] 空格或制表键
[:cntrl:] 任何控制字符
[:digit:] 数字 [0-9]
[:graph:] 任何可视字符(无空格)
[:lower:] 小写 [a-z]
[:print:] 非控制字符
[:punct:] 标点字符
[:space:] 空格
[:upper:] 大写 [A-Z]
[:xdigit:] 十六进制数字 [0-9 a-f A-F]

二,删除

其实我觉得吧,删除其实根替换一样,都是找出来进行一下操作而已,这个过程会牵扯到一些規则而已。

[zhangy@BlackGhost test]$ sed -e '1,14d' test
 @zhangying:*:1004:1004::/home/test:/bin/bash
 policykit:x:102:1005:Po

删除1,14行

[zhangy@BlackGhost mytest]$ sed -e '4,$d' test
 root:x:0:0:root:/root:/bin/bash
 bin:x:1:1:bin:/bin:/bin/false
 daemon:x:2:2:daemon:/sbin:/bin/false

删除4以后的行,包括第4行,把$当成最大行数就行了。哈哈

[zhangy@BlackGhost mytest]$ sed -e '/\(false\|bash\)$/d' test
 policykit:x:102:1005:Po

删除包括false的行,或者包括bash的行,别忘了加\

[zhangy@BlackGhost mytest]$ sed -e '/root/,/^test/d' test
 @zhangying:*:1004:1004::/home/test:/bin/bash
 policykit:x:102:1005:Po

删除从匹配root的行,到匹配以test开头的行,中间的行

三,读取,追加,插入文件

[zhangy@BlackGhost mytest]$ sed -e '/^root/r test2' test
 root:x:0:0:root:/root:/bin/bash
 =============
 -------------
 +++++++++++++
 bin:x:1:1:bin:/bin:/bin/false
 daemon:x:2:2:daemon:/sbin:/bin/false

读取test2的内容,并将其写入到匹配行的下面

[zhangy@BlackGhost mytest]$ sed '/[[:digit:]]/w test2' test

将匹配数字的行,写入test2中

[zhangy@BlackGhost mytest]$ sed  '/root/a\\ ===aaaa====' test
 root:x:0:0:root:/root:/bin/bash
 ===aaaa====
 bin:x:1:1:bin:/bin:/bin/false

将要插入的东西,插入匹配行的下面,

[zhangy@BlackGhost mytest]$ sed '/^daemon/i\\=================' test
 root:x:0:0:root:/root:/bin/bash
 bin:x:1:1:bin:/bin:/bin/false
 =================
 daemon:x:2:2:daemon:/sbin:/bin/false
 mail:x:8:12:mail:/var/spool/mail:/bin/false

正好根a相反,将要插入的东西,插入到匹配行的上面

四,调用命令文件

[zhangy@BlackGhost mytest]$ sed  -f cmd test |awk '{print $0;}'
 tank:x:0:0:tank:/tank:/tank/bash
 tank:x:1:1:tank:/tank:/tank/false
 ba:x:1002:1002::/home/zhangy:/tank/bash
 test:x:1003:1003::/home/test:/tank/bash
 @zhangying:*:1004:1004::/home/test:/tank/bash

cmd是个文件,内容如下

3,12d
s/root/tank/g



转载请注明
作者:海底苍鹰
地址:http://blog.51yip.com/shell/986.html