欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Linux正则表达式与文件格式化处理学习总结

程序员文章站 2022-04-03 13:25:51
...

1、正则表达式就是处理字符串的方法,它是以行为单位来进行字符串的处理行为

2、正则表达式通过一些特殊符号的辅助,可以让用户轻易达到查找、删除、替换某特定字符串的处理程序

3、只要工具程序支持正则表达式,那么该工具程序就可以用来作为正则表达式的字符串处理之用

4、正则表达式与通配符是完全不一样的,通配符代表的是bash操作接口的一个功能,但正则表达式则是一种字符串处理的表示方式

5、使用grep或其他工具进行正则表达式的字符串比较时,因为编码的问题会有不同的状态,因此最好将lANG等变量设置为C或者是en等英文语系

6、grep与egrep在正则表达式里面是很常见的两个程序,其中,egrep支持更严谨的正则表达式的语法

7、由于编码系统的不同,不同的语系会造成正则表达式选取数据的区别,因此可利用特殊符号如[:upper]来来替代编码范围较佳

8、由于严谨度不同正则表达式之上还有更严谨的扩展正则表达式

9、基础正则表达式的特殊字符有   *   ?   []    [-]   [^]    ^    $   等

10、常见的正则表达式工具有grep   sed    vim  等

11、printf可以通过一些特殊符号来将数据进行格式化输出

12、awk可以使用“字段”为依据,进行数据的重新整理与输出

13、文件的比较中,可以利用diff及cmp进行比较,其中diff主要用在纯文本文件方面的新旧版比较

14、patch命令可以将旧版数据更新到新版