脚本之简单的sed
(一)sed是什么?
sed是一个非交互式的文本编辑器,他可以对来自文本文件,以及标准输入的文本进行编辑,适用于较大的文本,且进行复杂的编辑工作。
(二)sed的执行过程
sed命令是从文件或者标准输入中一次性读取一行数据,将其复制到缓冲区,然后执行编辑命令对缓冲区的文本行进行编辑,重复此过程。流程如下图:
(三)sed的使用
sed的一般命令形式为:sed 【options】 【 script】 【inputfiles】
-
【options】常用选项可以为:
- -n 取消默认输出
- -e 允许执行多个脚本
- -f 从脚本文件中读取命令
- 【script】就是一个人脚本文件 其中存放进行s一系列的sed操作命令。
- 【inputfile】进行编辑的文件
(1)sed的命令的工作方式
直接用命令: sed 【options】 【commands】 【inputfile】
将sed的操作命令写入脚本: sed 【options】 -f 【scripts】 【inputfile】
例如:
假如要处理的文件为下列几行代码
jing 333 44
ti 22 kai
hhhhh sdf ssd
我想要将里面的全部数数字换成字符’a’ ,这时候可以执行命令 sed /s/[0-9]/a/g filename,但是我可以把/s/[0-9]/a/ 写入一个文本文件test,然后直接执行 sed -f test filename就OK了。把全部的的sed操作命令写入文件,然后授予该文件可执行权限 ./script 【inputfile】,注意在sed文件中要使用#!/bin/sed。
例如:定义一个test.sed
#! /bin/sed -f
/s/[0-9]/a/g
然后退出添加可执行权限后执行:./test/sed就OK了。
(2)使用行号定位行号
- num表示某一行 例如:sed -n ‘2 p’ filename 输出文件的第二行
- m,n 从m行到n行** sed -n ‘2,6 p’ filename
- m~n 指定起始行与步长, sed -n ‘1~2 p’ filename 输出奇数行
- $ 指定文件的最后一行sed -n ‘$p’ filename
(3) 使用正则表达式定位行号,一般形式为:/正则表达式/
- ^ /^ab/ 定位到行首为ab的行
- $ /ab$/ 定位到行尾为ab的行
- . /ab./ 定位到含有ab第三个字符为任意值得行
- * /ab*/ 定位含有第一个字符为a且接下来字符为零个或多个b的行
- [] /[abc]/ 含有中括号内任意字符的行
- [^] 与上一个元字符相反
- + 与*基本相同,只是前置符的出现次数至少为1
- ? 与+相对,前置符的出现次数至多为1
- {m,n} /s{m,n}/连续出现最少m次最多n次的行
(四)sed的操作
(1)选择文本,相当于grep egrep
例如:
sed -n ‘/^123/ p’ filename
sed -n ‘1 p’ filename
sed -n ‘1~2 p’ filename
sed -n ‘[abc]$ p’ filename
(2)替换文本
一般形式: 【add1】【add2】 【s/pattern/replace 】/【flags】
- 【add1】【add2】:要编辑的行号。
- 【s】:s(substitute)表示要进行文件替换操作的标志。
- 【pattern】:使用正则表达式表示的匹配模式。
- 【replace】:将要替代的字符或字符串。
- 【flags】:
- g 表示全局只要找到就会替换
- 十进制数 表示替换文本行第n个符合规则的字符串
- 空 没有指定,默认替换文本中第一个符合规则的字符串
例如:
sed ‘1,3 s/e/E/g’ filename
sed ‘1,/^2007/ s/e/E/g’ filename
(3)删除文本
一般形式:【addr1】 【addr2】 d
例如:
sed -e ‘1 d’ filename 删除第一行
sed -e ‘$ d’ filename 删除最后一行
sed -e ‘1~4 d’ filename 没走四行删除
sed -e ‘1,^2007’ filename 删除第一行一直到行首是2007的行
(4)追加文本
一般形式:【addr】 a string,表示在addr的位置添加一行string
例如:
sed ‘2 a 20000000’ filename 在第二行后面追加文本20000000
sed /^20022001/ a “jingtikai” filename 在以20022001开头的文本行后面追加文本“jingtikai”
(5)插入文本
一般形式:【addr】 i string
和追加文本一样,只不过是在addr的前面一行。此处就省略了。
(五)sed组合命令方式
(1)使用-e选项执行多个子命令
例如:
sed -e -n ‘s/e/E/g’ -e ‘2,3 p ’ filename首先执行第一个子命令,然后再执行第二个子命令。
注意:如果只有一个子命令,则-e可以省略。
(2)使用分号执行多个子命令
例如:
sed -e ‘s/e/E/g’;2 i 20002000 filenname
(3)对一个地址使用多个子命令
一般形式: address { commond1;commend2…}或者
address
{
commend1
commend2
…
}
例如:
sed -n ‘1,5 { s/e/E/g;s/a/A;2 i “jingtikai”;p}’ filename