欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

sed 学习笔记

程序员文章站 2022-03-04 17:54:06
...

 

原文在: https://github.com/wen866595/snaprecord/blob/master/shell/learn/sed.md

这里直接把github上的输出拷贝过来,效果不好,可以直接点击上面的链接查看原文。

sed 简介

sed(stream editor)是一个流编辑器,一次处理流的一行内容。

sed 命令模式
sed [options] 'command' file(s)
sed [options] -f scriptfile file(s)

常用options

  • -n 取消默认输出,只有经过sed特殊处理行(或者动作)才会被列出来。
  • -e 多重编辑模式。
  • -f 指定sed脚本文件名。
  • -i 直接修改文件内容。

地址

地址是用来确定希望编辑的行,可以用数字、正则、美元符($)来表示。也可以用逗号分隔的两个地址来表示希望编辑的范围,这个范围包括这两个地址所在的行。

[起始地址, 结束地址]

举例:


3              // 表示希望编辑第3行。
$              // 表示希望编辑最后那行。
4, 10          // 表示希望编辑4至10行,[4-10]。
2, $           // 表示希望编辑2至最后行,[2-$]。
/href/         // 表示希望编辑含有 href 字符的那些行。
2, /href/      // 表示希望编辑从第2行开始直到并包括第一个含有 href 字符的行。
/meta/,/link/  // 表示希望编辑从第一个含有 meta 字符的行 到 第一个含有 link 字符的行,
                      中间的行就算没有 meta 或 link 字符也会被命令处理。

正则元字符

因为sed用到很多正则,所以先补充点正则的知识。


^     表示行的开头。
$     表示行的结尾。
\     表示词尾,如 abc\>表示以abc为尾的单词。
.     句点表示任意单个字符
*     星号表示某个字符出现了0次或多次。
[]    字符集合。如[0-9]表示数字0-9中的任意一个,[a-zA-Z]表示字母中的任意一个。
          如果字符集以^开头表示非,如[^0-9]表示非数字。

这些正则跟其他编程语言中的正则差不多,除了 \<\>

sed 命令

有了前面的基础,就可以学习sed命令并实际运行了。

几乎所有命令都是这样:[address[,address]][!]{cmd} 。address可以是前面提到的定址中的任何一个。

s 替换命令

s 的命令模式是这样的:[address[, address]]s/pattern/replacement/g


 sed "s/my/you/g"  file          // 把file里的 my 替换为 you 
 sed "3,$s/my/you/g"  file       // 把file里 第3行 到 最后行 的 my 替换为 you
 sed "3,$s/t/T/3" file           // 把file里 第3行 到 最后行 的第三个 t 替换为 T
 sed "3,$s/t/T/3g" file          // 把file里 第3行 到 最后行 的 第三个开始 的
                                       t 替换为 T

 sed "1,3s/^/head/g" file        // 把file里 第1行 到 第3行 的行首加上 head
 sed "1,3s/¥/tail/g" file       // 把file里 第1行 到 第3行 的行首加上 tail

 sed "s/<[^>]*>//g"  file        // 去除file的html标签,标签通过正则 <[^>]*> 匹配,
                                        替换为空也就是删除了。

a 命令和 i 命令

a命令是append,i命令是insert,都可以用来添加行。区别在a是在匹配行后面添加新行,而i是在匹配行的前面添加新行。
命令模式: sed "[address[,address]]i newline" filesed "[address[,address]]a newline" file, i命令后面可以有任意数量的空格符。

举例:


sed "/coderbee/a    add new line ." csv.txt     
//  在每个包含 coderbee 的行的后面插入 newline 的新行。

sed "1,/coderbee/i    add new line ." csv.txt   
//  从第1行直到第1个包含 coderbee 的行,在这些行的前面插入 newline 的新行。

c 替换匹配行命令

sed "2c newline" csv.txt // 把第2行替换为 newline
sed "/coderbee/c newline" csv.txt // 把第匹配coderbee的行替换为 newline

d 删除匹配行命令

sed "2d" csv.txt // 把第2行删除
sed "/coderbee/d" csv.txt // 把第匹配coderbee的行删除

p 打印匹配行命令

sed -n "2p" csv.txt // 打印第2行
sed -n "/coderbee/p" csv.txt // 打印匹配coderbee的行

r/w 读写文件命令

但定位匹配行时,r命令可以读取指定的文件,并把文件的内容输出到输出流中,w命令可以把结果输出到指定的文件。

sed -n "1r tmp" csv.txt // 用 -n 属性屏蔽掉默认输出,当匹配到第1行时,读取文件tmp的内容到输出流。
sed -n "3w tmp" csv.txt // 用 -n 属性屏蔽掉默认输出,当匹配到第3行时,输出文件tmp的内容。

多个匹配

sed支持匹配多个模式,可以用 -e 选项开启多个匹配。

举例,把file里 [1-3] 行的 my 替换为 you, [3-5]行的 t 替换为 T :
sed "1,3s/my/you/g; 3,5s/t/T/g" file
这个也等价于:
sed -e "1,3s/my/you/g" -e "3,5s/t/T/g" file

圆括号匹配与变量

圆括号括起来的正则表达式所匹配的字符串可以当成变量来使用,按定义的顺序依次为 \1, \2, ... 。
& 可以当作被匹配的变量,这样可以在被匹配的变量左右加点东西。
通过变量还可以用来从流中抽取特定的值。


echo "abc=123" | sed  "s/\([^=]*\)=\(.*\)/\1==\2/g"        
// 将得到  abc==123
echo "123456789"  | sed "s/5/*&*/g"                        
// 将得到  1234*5*6789
echo "url='www.google.com'" | sed "s/url='\([^']*\)'/\1/g" 
// 将得到  www.google.com

命令打包

命令可以有多个,用逗号分隔,按先后顺序执行,用大括号括起来作为嵌套命令。


echo "abc1231" | sed -n -e "s/a/A/g; s/1/++/g; p"          
//  用逗号分隔多个命令,将得到 Abc++23++   
echo -e "abc 1\n    abc xyz" | sed -n "/abc/{/xyz/p}"      
//  嵌套命令,先匹配abc,再匹配xyz,成功后打印,得到:   abc xyz
echo -e "abc 1\n    abc xyz" | sed -n "/abc/{/xyz/{s/^ *//g;  p}}"`      
//  嵌套命令,先匹配abc,再匹配xyz,成功后,删除行首的空格,最后打印,得到:abc xyz
相关标签: sed