简介
linux
中的 cut
命令是一个命令行实用程序,用于从文件或标准输入中提取文本行的部分。当希望从文件或数据流中提取特定字段或列时,例如处理以逗号分隔或制表符分隔的文件时,它非常有用。
基础语法
cut
命令通过指定分隔符(例如空格、制表符或特定字符)并选择想要显示的列或字段来工作
cut option... [file]...
常用选项
-b, --bytes=list
:通过指定一个字节、一组字节或一个字节范围进行选择-c, --characters=list
:通过指定一个字符、一组字符或一个字符范围进行选择-d, --delimiter=delim
:指定将用来代替默认“tab”分隔符的分隔符-f, --fields=list
:仅选择这些字段;还打印任何不包含分隔符的行,除非指定了 -s 选项--complement
:补充选择。使用此选项时,cut 将显示除所选内容之外的所有字节、字符或字段-s, --only-delimited
:不打印不包含分隔符的行--output-delimiter=string
:cut 的默认行为是使用输入分隔符作为输出分隔符。此选项允许指定不同的输出分隔符字符串
范围选择
n
:第 n 个字节、字符或字段,从 1 开始计数n-
:从第 n 个字节、字符或字段到行尾n-m
:从第 n 到第 m (含) 个字节、字符或字段-m
:从第一个到第 m 个(含)字节、字符或字段
示例用法
-f:字段选择
此选项用于指定要提取哪些字段。字段由分隔符分隔(通常是制表符或空格,但可以使用 -d
选项指定任何分隔符)。
示例:要从文件中提取第一列和第三列
cut -f 1,3 filename
-d:分隔符
此选项指定分隔字段的分隔符。默认情况下,cut
假定字段由制表符分隔,但可以指定其他分隔符,如逗号、冒号或空格
示例:要从逗号分隔文件 (csv) 中提取字段
csv文件
name,age,location alice,30,new york bob,25,los angeles charlie,35,boston
cut -d ',' -f 1,3 filename
示例输出
name,location alice,new york bob,los angeles charlie,boston
-c:字符选择
这个选项允许从每行中提取特定字符。可以指定要提取的字符位置(或字符范围)
示例:提取每行位置 1 至 5 的字符
cut -c 1-5 filename
-b:字节选择
此选项允许根据字节而不是字符来截断输入。当处理面向字节的数据(例如二进制文件)时,此功能非常有用。
cut -b 1-5 filename
--complement:反向选择
该选项允许补充选择,这意味着它不是选择指定的字段,而是将其排除
示例:排除第一列(字段)并显示其余部分
cut -f 1 --complement filename
-s:禁止使用无分隔符的行
此选项会隐藏不包含分隔符的行。如果想要排除缺少分隔符的行,此选项非常有用
示例:从文件中提取字段并忽略没有分隔符的行
cut -d ',' -f 1 -s filename
提取特定字符
有一个字符串并想提取前 3 个字符
echo "abcdefg" | cut -c 1-3
输出
abc
提取多个字符范围
要提取多个范围的字符(例如,字符 1-3 和 6-8)
echo "abcdefg" | cut -c 1-3,6-8
输出
abcfg
使用 cut 和 ps 列出进程
可以使用 cut 从 ps 命令输出中提取特定信息
例如:提取进程id和正在运行的进程的命令
ps aux | cut -d ' ' -f 1,11
使用--complement排除字段
要从 passwd
文件中排除第一个字段(用户名)
cut -d ':' -f 1 --complement /etc/passwd
从 ls 的输出中提取特定列
此命令列出了文件和目录,但只输出它们的名称(ls -l 输出中的第 9 列)
ls -l | cut -d ' ' -f 9
获取当前目录中文件的磁盘使用情况
这将仅输出每个文件或目录的大小,不包括路径信息
du -h | cut -f 1
到此这篇关于linux使用cut进行文本提取的操作方法的文章就介绍到这了,更多相关linux cut文本提取内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论