awk命令
awk是shell进阶的重要命令,可以用来编排字段
awk把输入流看做一串记录的集合,每条记录都可以进一步细分为字段,一个awk程序是一对以模式和大括号框起来的操作组合而成的,awk每次从文件中读取一条记录
awk [选项] '条件{动作} 条件{动作}' 文件
-v 设置变量值
pattern {action} 如模式匹配,则执行操作 pattern {action}
# 打印第一个字段 awk 'print $1' # 打印整行 awk 'print $0' # 打印第2与第5个字段 awk 'print $2,$5' # 打印非空行 awk 'nf > 0 {print $0}'
在读取数据时,默认的分隔符是空格,可以使用-f来指定分隔符
#awk [-f 分隔符] '命令' input-file # 分隔符默认是空格 # 例: 打印出root用户记录 awk -f: '$1=="root"{print $0}' /etc/passwd
在输出数据时,默认的分隔符是空格,可以使用-v来设置输出字段分隔符
# 默认情况下,-v 改变输出字段的分隔字符,这里必须设置ofs变量来改变输出字段分隔符 awk -f: -v 'ofs=**' '{print $1,$5}' /etc/passwd
标量变量
保存单一值的变量叫做标量变量,常用的有
- filename 当前输入文件的名称
fnr 当前输入文件的当前行号,当有多个输入文档时相当有用
fnr == 3 选定第三条记录
- fs 字段分隔符,默认为空格
nf 当前记录的字段数
nf == 0 选定空记录
nf > 3 选定拥有三个字段以上的记录
nf < 5 选定第1到第4条记录
- nr 输入数据流的当前行号
- ofs 输出字段分隔字符,默认为空格
- ors 输出记录分隔字符,默认为\n
- rs 输入记录分隔字符
- $0 当前行的全部内容
- $n 当前行的第n的字段的内容
自定义变量
可以使用-v来设置自定义变量
free | awk -v age="10" -v name="lily" '{print name,age}' lily 10 lily 10 lily 10
begin和end
beigin
begin导致动作指令仅在读取任何数据记录之前执行一次
awk 'begin {print "ok"}' ok
end
end导致动作指令仅在读取完所有数据记录后执行一次
free | awk 'end {print "共有"nr"行"}' 共有3行
条件判断
awk还支持if判断语句
if(判断条件){
动作指令1;
} else if(判断条件2){
动作指令2;
} else {
动作指令n;
}
free | awk '{if(nr==1){print $1}else if(nr==2){print $2}}' total 8008932
循环语句
awk还支持循环,如for循环、while循环,且支持使用continue、break、exit来进行中断
for循环
for(表达式1;表达式2;表达式3) {
动作指令序列
}
awk 'begin{ for (i=1;i<=4;i++) {print i}}' 1 2 3 4
while循环
while(条件判断){
动作指令序列;
}
awk 'begin{ i=1; while(i<=4) {print i;i++}}' 1 2 3 4
命令行参数
awk通过内建变量argc(参数计数)和argv(参数值)让命令行参数可用
awk 'begin {print argv[0]}'
输出 awk
awk 'begin {for (k=0;k<argc;k++) print "argv["k"]=["argv[k]"]"}' a b c argv[0]=[awk] argv[1]=[a] argv[2]=[b] argv[3]=[c]
举例
统计磁盘可用空间
df | grep -v tmpfs | awk '{sum+=$4} end{print "磁盘可用容量:"sum/1024/1024"g"}''
磁盘可用容量:1.01912g
统计nginx各ip访问次数
awk ' \ > {ip[$3]++} \ > end { \ > for (i in ip) {print i,ip[i]} \ > }' /var/log/nginx/access.log
以上就是shell进阶awk命令编排字段使用详解的详细内容,更多关于shell awk命令编排字段的资料请关注代码网其它相关文章!
发表评论