linux awk 内置变量使用介绍
程序员文章站
2022-09-10 21:02:10
awk是个优秀文本处理工具,可以说是一门程序设计语言。下面是awk内置变量,需要的朋友可以参考下... 13-11-19...
一、内置变量表
属性 | 说明 |
$0 | 当前记录(作为单个变量) |
$1~$n | 当前记录的第n个字段,字段间由fs分隔 |
fs | 输入字段分隔符 默认是空格 |
nf | 当前记录中的字段个数,就是有多少列 |
nr | 已经读出的记录数,就是行号,从1开始 |
rs | 输入的记录他隔符默 认为换行符 |
ofs | 输出字段分隔符 默认也是空格 |
ors | 输出的记录分隔符,默认为换行符 |
argc | 命令行参数个数 |
argv | 命令行参数数组 |
filename | 当前输入文件的名字 |
ignorecase | 如果为真,则进行忽略大小写的匹配 |
argind | 当前被处理文件的argv标志符 |
convfmt | 数字转换格式 %.6g |
environ | unix环境变量 |
errno | unix系统错误消息 |
fieldwidths | 输入字段宽度的空白分隔字符串 |
fnr | 当前记录数 |
ofmt | 数字的输出格式 %.6g |
rstart | 被匹配函数匹配的字符串首 |
rlength | 被匹配函数匹配的字符串长度 |
subsep | \034 |
2、实例
1、常用操作
复制代码
代码如下:[chengmo@localhost ~]$ awk '/^root/{print $0}' /etc/passwd
root:x:0:0:root:/root:/bin/bash
/^root/ 为选择表达式,$0代表是逐行
2、设置字段分隔符号(fs使用方法)
复制代码
代码如下:[chengmo@localhost ~]$ awk 'begin{fs=":"}/^root/{print $1,$nf}' /etc/passwd
root /bin/bash
fs为字段分隔符,可以自己设置,默认是空格,因为passwd里面是”:”分隔,所以需要修改默认分隔符。nf是字段总数,$0代表当前行记录,$1-$n是当前行,各个字段对应值。
3、记录条数(nr,fnr使用方法)
复制代码
代码如下:[chengmo@localhost ~]$ awk 'begin{fs=":"}{print nr,$1,$nf}' /etc/passwd
1 root /bin/bash
2 bin /sbin/nologin
3 daemon /sbin/nologin
4 adm /sbin/nologin
5 lp /sbin/nologin
6 sync /bin/sync
7 shutdown /sbin/shutdown
……
nr得到当前记录所在行
4、设置输出字段分隔符(ofs使用方法)
复制代码
代码如下:[chengmo@localhost ~]$ awk 'begin{fs=":";ofs="^^"}/^root/{print fnr,$1,$nf}' /etc/passwd
1^^root^^/bin/bash
ofs设置默认字段分隔符
5、设置输出行记录分隔符(ors使用方法)
复制代码
代码如下:[chengmo@localhost ~]$ awk 'begin{fs=":";ors="^^"}{print fnr,$1,$nf}' /etc/passwd
1 root /bin/bash^^2 bin /sbin/nologin^^3 daemon /sbin/nologin^^4 adm /sbin/nologin^^5 lp /sbin/nologin
从上面看,ors默认是换行符,这里修改为:”^^”,所有行之间用”^^”分隔了。
6、输入参数获取(argc ,argv使用)
复制代码
代码如下:[chengmo@localhost ~]$ awk 'begin{fs=":";print "argc="argc;for(k in argv) {print k"="argv[k]; }}' /etc/passwd
argc=2
0=awk
1=/etc/passwd
argc得到所有输入参数个数,argv获得输入参数内容,是一个数组。
7、获得传入的文件名(filename使用)
复制代码
代码如下:[chengmo@localhost ~]$ awk 'begin{fs=":";print filename}{print filename}' /etc/passwd
/etc/passwd
filename,$0-$n,nf 不能使用在begin中,begin中不能获得任何与文件记录操作的变量。
8、获得linux环境变量(environ使用)
复制代码
代码如下:[chengmo@localhost ~]$ awk 'begin{print environ["path"];}' /etc/passwd
/usr/lib/qt-3.3/bin:/usr/kerberos/bin:/usr/lib/ccache:/usr/lib/icecc/bin:/usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbin:/usr/java/jdk1.5.0_17/bin:/usr/java/jdk1.5.0_17/jre/bin:/usr/local/mysql/bin:/home/web97/bin
environ是子典型数组,可以通过对应键值获得它的值。
9、输出数据格式设置:(ofmt使用)
复制代码
代码如下:[chengmo@localhost ~]$ awk 'begin{ofmt="%.3f";print 2/3,123.11111111;}' /etc/passwd
0.667 123.111
ofmt默认输出格式是:%.6g 保留六位小数,这里修改ofmt会修改默认数据输出格式。
10、按宽度指定分隔符(fieldwidths使用)
复制代码
代码如下:[chengmo@localhost ~]$ echo 20100117054932 | awk 'begin{fieldwidths="4 2 2 2 2 3"}{print $1"-"$2"-"$3,$4":"$5":"$6}'
2010-01-17 05:49:32
fieldwidths其格式为空格分隔的一串数字,用以对记录进行域的分隔,fieldwidths="4 2 2 2 2 2"就表示$1宽度是4,$2是2,$3是2 .... 。这个时候会忽略:fs分隔符。
11、rstart rlength使用
复制代码
代码如下:[chengmo@localhost ~]$ awk 'begin{start=match("this is a test",/[a-z]+$/); print start, rstart, rlength }'
11 11 4
[chengmo@localhost ~]$ awk 'begin{start=match("this is a test",/^[a-z]+$/); print start, rstart, rlength }'
0 0 –1
rstart 被匹配正则表达式首位置,rlength 匹配字符长度,没有找到为-1.
以上是:awk的一些内置变量使用,希望有什么问题可以与我交流。