linux中删除文件内空白行的几种方法。
linux中删除文件内空白行的几种方法
有时你可能需要在 linux 中删除某个文件中的空行。如果是的,你可以使用下面方法中的其中一个。有很多方法可以做到,但我在这里只是列举一些简单的方法。
你可能已经知道 grep、awk 和 sed 命令是专门用来处理文本数据的工具。
下列 5 种方法可以做到。
◈ sed:过滤和替换文本的流编辑器。
◈ grep:输出匹配到的行。
◈ cat:合并文件并打印内容到标准输出。
◈ tr:替换或删除字符。
◈ awk:awk 工具用于执行 awk 语言编写的程序,专门用于文本处理。
◈ perl:perl 是一种用于处理文本的编程语言。
我创建了一个 2daygeek.txt
文件来测试这些命令。下面是文件的内容。
1 yck@yck-virtual-machine:~$ cat 2dayweek.txt 2 hello world! 3 4 can you tell me yout name?
现在一切就绪,我们准备开始用多种方法来验证。
使用 sed 命令
sed 是一个流编辑器stream editor。流编辑器是用来编辑输入流(文件或管道)中的文本的。
1 yck@yck-virtual-machine:~$ sed '/^$/d' 2dayweek.txt 2 hello world! 3 can you tell me yout name?
以下是命令展开的细节:
◈ sed: 该命令本身。
◈ //
: 标记匹配范围。
◈ ^
: 匹配字符串开头。
◈ $
: 匹配字符串结尾。
◈ d
: 删除匹配的字符串。
◈ 2daygeek.txt
: 源文件名。
使用 grep 命令
grep 可以通过正则表达式在文件中搜索。该表达式可以是一行或多行空行分割的字符,grep 会打印所有匹配的内容。
1 yck@yck-virtual-machine:~$ grep -v "^$" 2dayweek.txt 2 hello world! 3 can you tell me yout name?
以下是命令展开的细节:
◈ grep: 该命令本身。
◈ .
: 替换任意字符。
◈ ^
: 匹配字符串开头。
◈ $
: 匹配字符串结尾。
◈ e
: 使用扩展正则匹配模式。
◈ e
: 使用常规正则匹配模式。
◈ v
: 反向匹配。
◈ 2daygeek.txt
: 源文件名。
使用 awk 命令
awk 可以执行使用 awk 语言写的脚本,大多是专用于处理文本的。awk 脚本是一系列 awk 命令和正则的组合。
1 yck@yck-virtual-machine:~$ awk '!/^$/' 2dayweek.txt 2 hello world! 3 can you tell me yout name?
以下是命令展开的细节:
◈ awk: 该命令本身。
◈ //
: 标记匹配范围。
◈ ^
: 匹配字符串开头。
◈ $
: 匹配字符串结尾。
◈ .
: 匹配任意字符。
◈ !
: 删除匹配的字符串。
◈ 2daygeek.txt
: 源文件名。
使用 cat 和 tr 命令 组合
cat 是串联(拼接)concatenate的简写。经常用于在 linux 中读取一个文件的内容。
cat 是在类 unix 系统中使用频率最高的命令之一。它提供了常用的三个处理文本文件的功能:显示文件内容、将多个文件拼接成一个,以及创建一个新文件。
tr 可以将标准输入中的字符转换,压缩或删除,然后重定向到标准输出。
1 yck@yck-virtual-machine:~$ cat 2dayweek.txt |tr -s '\n' 2 hello world! 3 can you tell me yout name?
以下是命令展开的细节:
◈ cat: cat 命令本身。
◈ tr: tr 命令本身。
◈ |
: 管道符号。它可以将前面的命令的标准输出作为下一个命令的标准输入。
◈ s
: 替换标数据集中任意多个重复字符为一个。
◈ \n
: 添加一个新的换行。◈ 2daygeek.txt
: 源文件名。
使用 perl 命令
perl 表示实用的提取和报告语言practical extraction and reporting language。perl 在初期被设计为一个专用于文本处理的编程语言,现在已扩展应用到 linux 系统管理,网络编程和网站开发等多个领域。
1 yck@yck-virtual-machine:~$ perl -ne 'print if /\s/' 2dayweek.txt 2 hello world! 3 can you tell me yout name?
以下是命令展开的细节:
◈ perl: perl 命令。
◈ n
: 逐行读入数据。
◈ e
: 执行某个命令。
◈ print
: 打印信息。
◈ if
: if 条件分支。
◈ //
: 标记匹配范围。
◈ \s
: 匹配任意非空白字符。
◈ 2daygeek.txt
: 源文件名。