Linux常用命令-文本处理-程序员宅基地

技术标签: 操作系统  

Linux文本处理工具

  文本处理工具

  • 文件内容: less 和cat
  • 文件截取:head和tail
  • 按列抽取:cut
  • 按关键字抽取:grep

  文件查看   cat

Usage: cat [OPTION]... [FILE]...
-E 显示行的结束符号$
-n 显示每一行的行号
-b 给非空行编号
-s 折叠空行为一行

  tac 倒序显示文件 

  分页查看文件内容

  • more 分页查看文件
    • more [options…] file...
    • -d 显示翻页以及退出提示
    • 空格翻一屏,回车翻一行
    • 输出自己退出
  • less 一页一页的查看文件或stdin输出
    • / 文本 搜索文本
    • 空格一屏 回车一行
    • n 向下搜索 N 向上搜索
    • q来退出
    • less 命令是man命令使用的分页器

  显示文本前或后行内容

  • head [option] … [file]… 默认10行
    • -c # 指定获取前#字节
    • -n # 指定获取前#行
    • -# 指定获取前#行
  • tail [options]…[file]… 默认10行
    • -c #指定获取后#字节
    • -n # 指定获取后#行
    • -# 指定获取后#行
    • -f 追踪显示文件fd新追加的内容,常用与日志监控
  • tailf 类似于 tail -f 当文件不增长时并不访问文件

  抽取文本cut

cut [option] ... [FILE] ...
-d 指明分隔符,默认tab
-f # 第#个字段
#,#[,#] 离散的多个字段,例如1,3,6
#-# 连续的多个字段
混合使用:1-3,7
-c 按照字符切割
cut -d: -f1 /etc/passwd
cat /etc/passwd|cut -d: -f7
cut -c2-5 /etc/passwd

  合并文件

paste 合并两个文件同行号的列到一行
paste[option]...[file]...
-d 分隔符 指定分隔符,默认是tab
-s 所有行合并成一行显示
paste f1 f2
paste -d: f1 f2
paste -s f1 f2

  分析文本的工具

  文本数据统计 wc (word count)

  • 计数单词总数、行总数、字节总数和字符总数
  • 可以对文件或者stdin中的数据进行统计
[root@centos ~]#wc a.sh
 4  5 30 a.sh
 行数  字数 字节数 文件
 -l 只统计行数
 -w 只统计单词总数
 -c 只统计字节总数
 -m 只统计字符总数
 -L 显示文件中最长行的长度

  文本排序 sort

把整理过的文本显示在stdout 不改变原始文件

sort [options] files 默认是字母排序
-r 执行倒序排列
-R 随机排序
-n 按数字大小排序
-f 忽略大小写
-t 指定切割符号
-t c 执行分隔符 -k 按第几列来进行排序

  删除重复行 uniq

从输入中删除前后相接的重复的行

uniq [option] ...[file]
-c 显示每行重复出现的次数
-d 仅显示重复过的行
-u 仅显示不曾重复的行
连续且完全相同才为重复
经常使用方案
sort filename |uniq -c
ss -tnp|cut -d: -f2|tr -s " "|cut -d" " -f2|sort -n|uniq -c

  比较文件

diff filename filename

 

[root@localhost jiangyi]#echo "abc" >b
[root@localhost jiangyi]#echo "abcd" >d
[root@localhost jiangyi]#diff b d
1c1
< abc
---
> abcd
[root@localhost jiangyi]#echo "abcde" >b
[root@localhost jiangyi]#diff b d
1c1
< abcde
---
> abcd
[root@localhost jiangyi]#echo "abcde" >> b
[root@localhost jiangyi]#diff b d
1,2c1
< abcde
< abcde
---
> abcd
[root@localhost jiangyi]#echo "abcd" >> b
[root@localhost jiangyi]#diff b d
1,2d0
< abcde
< abcde

 

转载于:https://www.cnblogs.com/Xiao_Xu/p/11284838.html

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/baiju1963/article/details/101680879

智能推荐

PyTorch专栏开篇-程序员宅基地

文章浏览阅读231次。目前研究人员正在使用的深度学习框架不尽相同,有 TensorFlow 、PyTorch、Keras等。这些深度学习框架被应用于计算机视觉、语音识别、自然语言处理与生物信息学等领域,并获取了极好的效果。其中,PyTorch是当前难得的简洁优雅且高效快速的框架,当前开源的框架中,没有哪一个框架能够在灵活性、易用性、速度这三个方面有两个能同时超过PyTorch。基于此,磐小仙邀请到了作者 News(..._pytorch专栏开篇

error LNK2026: 模块对于 SAFESEH 映像是不安全的_error lnk2026: 模块对于 safeseh 映像是不安全的。-程序员宅基地

文章浏览阅读1.2k次。其他版本 更新:2007 年 11 月/SAFESEH[:NO]在指定 /SAFESEH 后,只有在链接器还可以生成映像的安全异常处理程序表的情况下,该链接器才会生成一个映像。该表指定其异常处理程序适合于该映像的操作系统。只有在对 x86 目标进行链接时,/SAFESEH 才有效。已说明异常处理程序的平台不支持 _error lnk2026: 模块对于 safeseh 映像是不安全的。

python修改列表元素_python中修改列表元素-程序员宅基地

文章浏览阅读732次。广告关闭腾讯云11.11云上盛惠 ,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高返5000元!在整个游戏运行期间,敌人列表的长度将不断变化。 我们将用这个游戏的设想贯穿始终,修改列表中元素、添加列表中元素、删除列表中元素的讲解中,首先,我们先看如何修改列表中的元素。 python中,修改列表元素的语法与访问列表元素的语法类似。 要修改列表元素,可指定列表名和要修改的元素的索引..._python修改列表元素

HTML最全语法概述、文件的基本结构、Web标准(W3C)、基本标记_简述html的语法规范是什么-程序员宅基地

文章浏览阅读1k次。一、简介1.网页是组成一个网站的最基本的元素,一个网站做的好不好,就要看网页是如何编写的2.互联网上的信息,都是以网页的形式来给大家进行呈现的,所以网页实际上就是我们一个网站,或者网络信息传递的载体。网页文件使用一种特殊的标记语言所写的,这个标记语言的名称:HTML(超文本标记语言 Hyper Text Markup language)3.概念:Html是一种标记语言,不是编程语言,主要作用..._简述html的语法规范是什么

uni的numberbox怎么用_NumberBox( 数值输入框) 组件-程序员宅基地

文章浏览阅读400次。本节课重点了解 EasyUI 中 NumberBox(数值输入框)组件的使用方法,这个组件依赖于 ValidateBox(验证框)组件。一. 加载方式//class 加载方式data-options="min:0,precision:2">//JS 加载调用$('#box').numberbox({min : 0,precision : 2,});二. 属性列表//属性设置$('#box')..._numberbox中data-options

SO_RCVTIMEO超时errno_recv -1 errno 4 so_rcvtimeo-程序员宅基地

文章浏览阅读660次。首先打印一次recv调用失败的errno值和各个宏的值.由上可知,EAGIN和EWOULDBLOCK的值都是11,其实EAGIN是在setsockopt设置SO_RCVTIMEO或SO_SNDTIMEO后,recv或者send系列函数超时等待返回-1,此时的errno值。EWOULDBLOCK则是大家熟悉的异步调用产生的errno。recv return -1,errn..._recv -1 errno 4 so_rcvtimeo

随便推点

python数据格式化之pprint-程序员宅基地

文章浏览阅读46次。2019独角兽企业重金招聘Python工程师标准>>> ..._data=l'a','b','c','d','e','f','g','h']for i in data[1:6:2]:print(i)

关于listview,gridview里面数据显示不全的问题_gridview 数据少了-程序员宅基地

文章浏览阅读1k次。listview,girdview这些控件在我们android开发经常用的到,但是,数据显示不全的问题也是我们经常碰到的,下面只要在代码中加入几行代码即可以下方法仅供参考,转自网络listview控件显示数据private void listFitHeight(ListView listView){ RepairDetailInfosAdpter listAdapter=(RepairDet_gridview 数据少了

使用开源软件Prometheus监控企业内部应用_8919 hostname关联-程序员宅基地

文章浏览阅读6.6k次。使用开源软件Prometheus监控企业内部资源1. 写在前面​ 在电厂行政管理大区内,因为业务体量小,业务变化相对少,之前公司采用的监控技术栈较为落后,只有简单的北塔网络监控,基本没有任何的监控平台。​ 接触Docker和kubernetes时间久了,开源的监控方案所接触。网上也有不少Zabbix、Nagios、Open-Falcon、Prometheus、Influxdb的对比这里就不一一列举了。最终平海电厂选择Prometheus+Grafana+explorer技术栈作为企_8919 hostname关联

启动hbase时,hregionserver没有启动的原因-程序员宅基地

文章浏览阅读477次。今天配置hbase的时候发现有几台机器的regionserver启不来。报错例如以下: at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method) at sun.reflect.NativeConstructorAccessorImpl.newInstance(N..._启动hbase没有hquorumpeer和hregionserver

UI-父视图和子视图之间的关系_ug删除父视图子视图也没了,怎么取消关联-程序员宅基地

文章浏览阅读1.5k次。//// ViewController.m// 父控件与子控件#import "ViewController.h"@interface ViewController ()@end@implementation ViewController- (void)viewDidLoad { [super viewDidLoad]; /** *_ug删除父视图子视图也没了,怎么取消关联

NDK .so Android调用JNI出错 java.lang.UnsatisfiedLinkError: No implementation found for的解决方案_ndk java.lang.unsatisfiedlinkerror: no implementat-程序员宅基地

文章浏览阅读1.4w次,点赞2次,收藏6次。抛异常:09-15 02:55:15.835 10255-10255/com.example.fanenqian.jndk E/AndroidRuntime: FATAL EXCEPTION: main Process: com.examp_ndk java.lang.unsatisfiedlinkerror: no implementation found for

推荐文章

热门文章

相关标签