sed工具的基本使用方法
文本处理器
在 Linux/UNIX 系统中包含很多种文本处理器或文本编辑器,其中包括我们之前学习过的VIM 编辑器与 grep 等。而 grep,sed,awk 更是 shell 编程中经常用到的文本处理工具,被称之为 Shell 编程三剑客。
sed 工具
sed(Stream EDitor)是一个强大而简单的文本解析转换工具,可以读取文本,并根据指定的条件对文本内容进行编辑(删除、替换、添加、移动等),最后输出所有行或者仅输出处理的某些行。sed 也可以在无交互的情况下实现相当复杂的文本处理操作,被广泛应用于 Shell 脚本中,用以完成各种自动化处理任务。
sed的工作流程主要包括读取、执行和显示三个过程。
(1)读取:sed 从输入流(文件、管道、标准输入)中读取一行内容并存储到临时的缓冲区中(又称模式空间,pattern space)。
(2)执行:默认情况下,所有的 sed 命令都在模式空间中顺序地执行,除非指定了行的地址,否则 sed 命令将会在所有的行上依次执行。
(3)显示:发送修改后的内容到输出流。再发送数据后,模式空间将会被清空。
在所有的文件内容都被处理完成之前,上述过程将重复执行,直至所有内容被处理完。
注意:默认情况下,所有的 sed 命令都是在模式空间内执行的,因此输入的文件并不会发生任何变化,除非是用重定向存储输出
1、sed命令常见用法
调用 sed 命令有两种格式。其中,“参数”是指操作的目标文件,当存在多个操作对象时用,文件之间用逗号“,”分隔;而 scriptfile 表示脚本文件,需要用“-f”选项指定,当脚本文件出现在目标文件之前时,表示通过指定的脚本文件来处理输入的目标文件。
sed[选项] '操作' 参数
sed [选项] -f scriptfile 参数
常见的sed命令选项主要包含以下几种:
(1)e 或–expression=:表示用指定命令或者脚本来处理输入的文本文件。
(2)-f 或–file=:表示用指定的脚本文件来处理输入的文本文件。
(3)-h 或–help:显示帮助。
(4)-n、–quiet 或 silent:表示仅显示处理后的结果。
(5)-i:直接编辑文本文件。
“操作”用于指定对文件操作的动作行为,也就是 sed 的命令。通常情况下是采用的“[n1[,n2]]”操作参数的格式。n1、n2 是可选的,不一定会存在,代表选择进行操作的行数,如操作需要在 5~20 行之间进行,则表示为“5,20 动作行为”。常见的操作包括以下几种。
(1)a:增加,在当前行下面增加一行指定内容。
(2)c:替换,将选定行替换为指定内容。
(3)d:删除,删除选定的行。
(4)i:插入,在选定行上面插入一行指定内容。
(5)p:打印,如果同时指定行,表示打印指定行;如果不指定行,则表示打印所有内容;如果有非打印字符,则以 ASCII 码输出。其通常与“-n”选项一起使用。
(6)s:替换,替换指定字符。
(7)y:字符转换。
2、sed用法示例
在进行sed用法前准备一个名为abc.txt的测试文件,文件具体内容如下:
[aaa@qq.com ~]# vim abc.txt
he was short and fat.
He was wearing a blue polo shirt with black pants. The home of Football on BBC Sport online.
the tongue is boneless but it breaks bones.12! google is the best tools for search keyword.
The year ahead will test our political establishment to the limit.
PI=3.141592653589793238462643383249901429
a wood cross!
Actions speak louder than words
#woood
# #woooooood
# AxyzxyzxyzxyzC
I bet this place is really spooky late at night!
Misfortunes never come alone/single.
I shouldn't have lett so tast.
23674
abf343
??4222345
34
9
1)输出符合条件的文本(p表示正常输出)
[aaa@qq.com ~]# sed -n 'p' abc.txt //输出所有内容,等同于cat abc.txt
输出第3行
[aaa@qq.com ~]# sed -n '3p' abc.txt
输出3^5行
[aaa@qq.com ~]# sed -n '3,5p' abc.txt
输出所有奇数行,n表示读入下一行资料
[aaa@qq.com ~]# sed -n 'p;n' abc.txt
输出所有偶数行,n 表示读入下一行资料
[aaa@qq.com ~]# sed -n 'n;p' abc.txt
输出第 10 行至文件尾之间的偶数行
[aaa@qq.com ~]# sed -n '10,${n;p}' abc.txt
在执行“sed –n‘10,${n;p}’test.txt”命令时,读取的第 1 行是文件的第 10 行,
读取的第 2 行是文件的第 11 行,依此类推,所以输出的偶数行是文件的第 11 行、13 行直至文件结尾,其中包括空行。
以上是 sed 命令的基本用法,sed 命令结合正则表达式时,格式略有不同,正则表达式以“/”包围。例如,以下操作是 sed 命令与正则表达式结合使用的示例。
1、输出包含the 的行
[aaa@qq.com ~]# sed -n '/the/p' abc.txt
2、输出从第 4 行至第一个包含 the 的行
[aaa@qq.com ~]# sed -n '4,/the/p' abc.txt
3、输出包含the 的行所在的行号,等号(=)用来输出行号
[aaa@qq.com ~]# sed -n '/the/=' abc.txt
4、输出以PI 开头的行
[aaa@qq.com ~]# sed -n '/^PI/p' abc.txt
5、输出以数字结尾的行
[aaa@qq.com ~]# sed -n '/[0-9]$/p' abc.txt
6、输出包含单词wood 的行,<、>代表单词边界
[aaa@qq.com ~]# sed -n '/\<wood\>/p' abc.txt
2)删除符合条件的文本(d)
因为后面的示例还需要使用测试文件 test.txt,所以在执行删除操作之前需要先将测试文件备份。以下示例分别演示了 sed 命令的几种常用删除用法。
下面命令中 nl 命令用于计算文件的行数,结合该命令可以更加直观地查看到命令执行的结果。
1、删除第 3 行
[aaa@qq.com ~]# cp -p abc.txt 123.txt //备份
[aaa@qq.com ~]# nl 123.txt | sed '3d'
2、删除第 3~5 行
[aaa@qq.com ~]# nl 123.txt | sed '3,5d'
3、//删除包含cross 的行,原本的第 8 行被删除
//删除不包含cross 的行,用!符号表示取反操作,如’/cross/!d’
[aaa@qq.com ~]# nl 123.txt | sed '/cross/d'
4、删除以小写字母开头的行
[aaa@qq.com ~]# sed '/^[a-z]/d' 123.txt
5、删除以"."结尾的行
[aaa@qq.com ~]# sed '/\.$/d' 123.txt
6、删除所有空行
[aaa@qq.com ~]# sed '/^$/d' 123.txt
注意: 若是删除重复的空行,即连续的空行只保留一个, 执行“ sed –e ‘/^KaTeX parse error: Expected group after '^' at position 6: /{n;/^̲/d}’test.txt”命令即可实现。其效果与“cat -s test.txt”相同,n 表示读下一行数据。
3)替换符合条件的文本
在使用 sed 命令进行替换操作时需要用到 s(字符串替换)、c(整行/整块替换)、y(字符转换)命令选项
1、将每行中的第一个the 替换为 THE
[aaa@qq.com ~]# sed 's/the/THE/' 123.txt
2、/将每行中的第 3 个l 替换为L
[aaa@qq.com ~]# sed 's/l/L/3' 123.txt
3、将文件中的所有the 替换为THE
[aaa@qq.com ~]# sed 's/the/THE/g' 123.txt
4、将文件中的所有o 删除(替换为空串)
[aaa@qq.com ~]# sed 's/o//g' 123.txt
5、在每行行首插入#号
[aaa@qq.com ~]# sed 's/^/#/g' 123.txt
6、在包含the 的每行行首插入#号
[aaa@qq.com ~]# sed '/the/s/^/#/g' 123.txt
7、在每行行尾插入字符串EOF
[aaa@qq.com ~]# sed 's/$/EOF/g' 123.txt
8、将第 3~5 行中的所有the 替换为 THE
[aaa@qq.com ~]# sed '3,5s/the/THE/g' 123.txt
9、将包含the 的所有行中的o 都替换为 O
[aaa@qq.com ~]# sed '/the/s/o/O/g' 123.txt
4)迁移符合条件的文本
H,复制到剪贴板;
g、G,将剪贴板中的数据覆盖/追加至指定行;
w,保存为文件;
r,读取指定文件;
a,追加指定内容。
1、将包含the 的行迁移至文件末尾,{;}用于多个操作
[aaa@qq.com ~]# sed '/the/{H;d};$G' 123.txt
2、将第 1~5 行内容转移至第 17 行后
[aaa@qq.com ~]# sed '1,5{H;d};17G' 123.txt
3、将包含the 的行另存为文件/opt/out.file
[aaa@qq.com ~]# sed '/the/w /opt/out.file' 123.txt
4、将文件/etc/hostname 的内容添加到
包含the 的每行以后
[aaa@qq.com ~]# sed '/the/r /etc/hostname' 123.txt
5、在第 3 行后插入一个新行,内容为 New
[aaa@qq.com ~]# sed '3aNEW' 123.txt
6、在包含the 的每行后插入一个新行,内容为 New
[aaa@qq.com ~]# sed '/the/aNEW' 123.txt
7、在第 3 行后插入多行内容,中间的\n 表示换行
[aaa@qq.com ~]# sed '3aNEW\nNEW2\nNEW3' 123.txt
5)使用脚本编辑文件
使用 sed 脚本,将多个编辑指令存放到文件中(每行一条编辑指令),通过“-f”选项来调用。
将第 1~5 行内容转移至第 17 行后
[aaa@qq.com ~]# sed '1,5{H;d};17G' 123.txt
以上操作可以改用脚本文件方式:
[aaa@qq.com ~]# vim opt.list
1,5H
1,5d
17G
[aaa@qq.com ~]# sed -f opt.list 123.txt
6)sed 直接操作文件示例
编写一个脚本,用来调整 vsftpd 服务配置:禁止匿名用户,但允许本地用户(也允许写入)。
aaa@qq.com ~]# vim wq.com
#!/bin/bash
# 指定样本文件路径、配置文件路径
SAMPLE="/usr/share/doc/vsftpd-3.0.2/EXAMPLE/INTERNET_SITE/vsftpd.conf " CONFIG="/etc/vsftpd/vsftpd.conf"
# 备份原来的配置文件,检测文件名为/etc/vsftpd/vsftpd.conf.bak 备份文件是否存在, 若不存在则使用 cp 命令进行文件备份
[ ! -e "$CONFIG.bak" ] && cp $CONFIG $CONFIG.bak # 基于样本配置进行调整,覆盖现有文件
sed -e '/^anonymous_enable/s/YES/NO/g' $SAMPLE > $CONFIG
sed -i -e '/^local_enable/s/NO/YES/g' -e'/^write_enable/s/NO/YES/g' $CONFIG
grep "listen" $CONFIG || sed -i '$alisten=YES' $CONFIG
# 启动vsftpd 服务,并设为开机后自动运行systemctl restart vsftpd
systemctl enable vsftpd
[aaa@qq.com ~]# chmod +x wq.sh
[aaa@qq.com ~]# ./wq.sh