Linux Shell 011-正则表达式_regexp linux-程序员宅基地

技术标签: 运维  Linux Shell脚本  linux  正则表达式  bash  centos  

Linux Shell 011-正则表达式

本节关键字:Linux、Bash Shell、正则表达式
相关指令:grep、sed

正则表达式介绍

正则表达式(Regular Expression、regex或regexp,缩写为RE),也译为正规表示法、常规表示法,是一种字符模式,用于在查找过程中匹配指定的字符。

许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。

支持正则表达式的程序如:locate |find| vim| grep| sed |awk

正则表达式中的名词

元字符:指那些在正则表达式中具有特殊意义的专用字符,例如:点(.)、星(*)、问号(?)等
前导字符:位于元字符前面的字符,例如:ab**c***、aoo**o.**

正则表达式中常用的普通元字符

元字符 功能 备注
. 匹配除了换行符以外的任意单个字符
* 前导字符出现0次或连续多次
.* 任意长度字符 ab.*
^ 行首(以…开头) ^root
$ 行尾(以…结尾) bash$
^$ 空行
[] 匹配括号里任意单个字符或一组单个字符 [abc]
[^] 匹配不包含括号里任一单个字符或一组单个字符 [^abc]
^[] 匹配以括号里任意单个字符或一组单个字符开头 ^[abc]
^[^] 匹配不以括号里任意单个字符或一组单个字符开头 ^[^abc]

正则表达式中其它常用元字符

元字符 功能 备注
\< 取单词的头
\> 取单词的尾
\< \> 精确匹配
\{n\} 匹配前导字符连续出现n次
\{n,\} 匹配前导字符至少出现n次
\{n,m\} 匹配前导字符出现n次与m次之间
\( \) 保存被匹配的字符
\d 匹配数字(grep -P [0-9]
\w 匹配字母数字下划线(grep -P [a-zA-Z0-9_]
\s 匹配空格、制表符、换页符(grep -P [\t\r\n]

使用示例

需求:将10.1.1.1替换成10.1.1.254

# vim编辑器支持正则表达式
$ vim 1.txt
:%s#\(10.1.1\).1#\1.254#g 
:%s/\(10.1.1\).1/\1.254/g 

# sed支持正则表达式
$ sed -n 's#\(10.1.1\).1#\1.254#p' 1.txt

# 说明:
# 找出含有10.1.1的行,同时保留10.1.1并标记为标签1,
# 之后可以使用\1来引用它。最多可以定义9个标签,从左边开始编号,最左边的是第一个。

需求:将helloworld yourself 换成hellolilei myself

$ vim 1.txt
:%s#\(hello\)world your\(self\)#\1lilei my\2#g

$ sed -n 's/\(hello\)world your\(self\)/\1lilei my\2/p' 1.txt 
$ sed -n 's/helloworld yourself/hellolilei myself/p' 1.txt 
$ sed -n 's/\(hello\)world your\(self\)/\1lilei my\2/p' 1.txt 

Perl内置正则:

正则语法 说明
\d 匹配数字 [0-9]
\w 匹配字母数字下划线[a-zA-Z0-9_]
\s 匹配空格、制表符、换页符[\t\r\n]

使用示例

$ grep -P '\d' 1.txt
$ grep -P '\w' 2.txt
$ grep -P '\s' 3.txt

正则表达式扩展类常用元字符

扩展元字符 功能 备注
+ 匹配一个或多个前导字符 bo+ 匹配boo、 bo
? 匹配零个或一个前导字符 bo? 匹配b、 bo
| 匹配a或b
() 组字符(看成整体) (my|your)self:表示匹配myself或匹配yourself
{n} 前导字符重复n次
{n,} 前导字符重复至少n次
{n,m} 前导字符重复n到m次

使用示例

使用提示:

  • grep要用必须加 -E 或者使用egrep
  • sed要用必须加 -r
$ grep "root|ftp|adm" /etc/passwd
$ egrep "root|ftp|adm" /etc/passwd
$ grep -E "root|ftp|adm" /etc/passwd

$ grep -E 'o+gle' test.txt 
$ grep -E 'o?gle' test.txt 

$ egrep 'go{2,}' 1.txt
$ egrep '(my|your)self' 1.txt


# 使用正则过滤出文件中的IP地址:
$ grep '[0-9]\{2\}\.[0-9]\{1\}\.[0-9]\{1\}\.[0-9]\{1\}' 1.txt 
$ grep '[0-9]{2}\.[0-9]{1}\.[0-9]{1}\.[0-9]{1}' 1.txt 
$ grep -E '[0-9]{2}\.[0-9]{1}\.[0-9]{1}\.[0-9]{1}' 1.txt 
$ grep -E '[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}' 1.txt 
$ grep -E '([0-9]{1,3}\.){3}[0-9]{1,3}' 1.txt 

第二类正则表达式

表达式 功能 示例
[:alnum:] 字母与数字字符 [[:alnum:]]+
[:alpha:] 字母字符(包括大小写字母) [[:alpha:]]{4}
[:blank:] 空格与制表符 [[:blank:]]*
[:digit:] 数字 [[:digit:]]?
[:lower:] 小写字母 [[:lower:]]{4,}
[:upper:] 大写字母 [[:upper:]]+
[:punct:] 标点符号 [[:punct:]]
[:space:] 包括换行符,回车等在内的所有空白 [[:space:]]+

使用示例

$ grep -E '^[[:digit:]]+' 1.txt
$ grep -E '^[^[:digit:]]+' 1.txt
$ grep -E '[[:lower:]]{4,}' 1.txt

正则表达式总结

要找什么?

需求 解决方案
找数字 [0-9]
找字母 [a-zA-Z]
找标点符号 [[:punct:]]

如何找?

需求 解决方案
以什么为首 ^key
以什么结尾 key$
包含什么或不包含什么 [abc] ^[abc] [^abc] ^[^abc]

要找多少?

需求 解决方案
找前导字符出现0次或连续多次 ab*
找任意单个(一次)字符 ab.
找任意字符 ab.*
找前导字符连续出现几次 {n} {n,m} {n,}
找前导字符出现1次或多次 go+
找前到字符出现0次或1次 go?

正则表达式元字符一览表

元字符 功能 示例
* 前导字符出现0次或者连续多次 ab* abbbb
. 除了换行符以外,任意单个字符 ab. ab8 abu
.* 任意长度的字符 ab.* adfdfdf
[] 括号里的任意单个字符或一组单个字符 [abc][0-9][a-z]
[^] 不匹配括号里的任意单个字符或一组单个字符 [^abc]
^[] 匹配以括号里的任意单个字符开头 ^[abc]
[] 不匹配以括号里的任意单个字符开头
^ 行的开头 ^root
$ 行的结尾 bash$
^$ 空行
\{n\}和{n} 前导字符连续出现n次 [0-9]\{3\}
\{n,\}和{n,} 前导字符至少出现n次 [a-z]{4,}
\{n,m\}和{n,m} 前导字符连续出现n-m次 go{2,4}
\<\> 精确匹配单词 \<hello\>
\(\) 保留匹配到的字符 \(hello\)
+ 前导字符出现1次或者多次 [0-9]+
? 前导字符出现0次或者1次 go?
| root|ftp
() 组字符 (hello|world)123
\d perl内置正则 grep -P \d+
\w 匹配字母数字下划线

正则表达式使用示例

1、查找不以大写字母开头的行(三种写法)。
$ grep '^[^A-Z]' 2.txt
$ grep -v '^[A-Z]' 2.txt
$ grep '^[^[:upper:]]' 2.txt

2、查找有数字的行(两种写法)
$ grep '[0-9]' 2.txt
$ grep -P '\d' 2.txt

3、查找一个数字和一个字母连起来的
$ grep -E '[0-9][a-zA-Z]|[a-zA-Z][0-9]' 2.txt

4、查找不以r开头的行
$ grep -v '^r' 2.txt
$ grep '^[^r]' 2.txt

5、查找以数字开头的
$ grep '^[0-9]' 2.txt

6、查找以大写字母开头的
$ grep '^[A-Z]' 2.txt

7、查找以小写字母开头的
$ grep '^[a-z]' 2.txt

8、查找以点结束的
$ grep '\.$' 2.txt

9、去掉空行
$ grep -v '^$' 2.txt

10、查找完全匹配abc的行
$ grep '\<abc\>' 2.txt

11、查找A后有三个数字的行
$ grep -E 'A[0-9]{3}' 2.txt
$ grep  'A[0-9]\{3\}' 2.txt

12、统计root在/etc/passwd里出现了几次
$ grep -o 'root' 1.txt |wc -l

13、用正则表达式找出自己的IP地址、广播地址、子网掩码
$ ifconfig eth0|grep Bcast|grep -o '[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}'
$ ifconfig eth0|grep Bcast| grep -E -o '([0-9]{1,3}.){3}[0-9]{1,3}'
$ ifconfig eth0|grep Bcast| grep -P -o '\d{1,3}.\d{1,3}.\d{1,3}.\d{1,3}'
$ ifconfig eth0|grep Bcast| grep -P -o '(\d{1,3}.){3}\d{1,3}'
$ ifconfig eth0|grep Bcast| grep -P -o '(\d+.){3}\d+'
$ egrep --color '[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}' /etc/sysconfig/network-scripts/ifcfg-eth0
$ egrep --color '[[:digit:]]{1,3}\.[[:digit:]]{1,3}\.[[:digit:]]{1,3}\.[[:digit:]]{1,3}' /etc/sysconfig/network-scripts/ifcfg-eth0 

14、找出文件中的ip地址并且打印替换成172.16.2.254
$ grep -o -E '([0-9]{1,3}\.){3}[0-9]{1,3}' 1.txt |sed -n 's/192.168.0.\(254\)/172.16.2.\1/p'

15、找出文件中的ip地址
$ grep -o -E '([0-9]{1,3}\.){3}[0-9]{1,3}' 1.txt

16、找出全部是数字的行
$ grep -E '^[0-9]+$' test

17、找出邮箱地址
$ grep -E '^[0-9]+@[a-z0-9]+\.[a-z]+$'

帮助说明

$ grep --help
# 匹配模式选择:
# Regexp selection and interpretation:
  -E, --extended-regexp     扩展正则
  -G, --basic-regexp        基本正则
  -P, --perl-regexp         调用perl的正则
  -e, --regexp=PATTERN      use PATTERN for matching
  -f, --file=FILE           obtain PATTERN from FILE
  -i, --ignore-case         忽略大小写
  -w, --word-regexp         匹配整个单词
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_45157350/article/details/135168098

智能推荐

浏览器安全之同源策略_浏览器同源策略-程序员宅基地

文章浏览阅读1.2k次。明确定义集成系统之间的接口和端点。确定HTTP请求和响应的格式,包括使用的数据编码格式(如JSON或XML),以及请求和响应的头部信息。定义HTTP的接口,首先应该确定接口功能和目标,明确接口的目的和提供的功能。确定接口所要实现的业务逻辑或服务,并理解它在整个系统中的角色和作用。然后选择HTTP方法和端点,根据接口的功能,选择合适的HTTP方法(如GET、POST、PUT、DELETE等)来表示接口的操作类型。同时,定义接口的端点(Endpoint),即接口的URL路径,例如:/api/users。_浏览器同源策略

【ARM 裸机】BSP 工程管理

ARM 裸机,BSP 工程管理,之后的工程结构一目了然,层次分明,不再乱乱了

三 STM32F4使用Sys_Tick 实现微秒定时器和延时_stm32如何实现定时器-程序员宅基地

文章浏览阅读3.3k次,点赞46次,收藏48次。时钟是由电路产生的周期性的脉冲信号,相当于单片机的心脏。_stm32如何实现定时器

Python爱心代码

【代码】Python爱心代码。

CSS-文本换行处理-white-space_white-space;normal-程序员宅基地

文章浏览阅读2.3k次,点赞4次,收藏3次。简介:本文主要介绍通过设置CSS的white-space属性来处理元素内的空白、空白符,以实现文本的不换行、自动换行、空白保留或合并。详情参考:https://timor419.github.io/2021/04/07/CSS-white-space/这边先列一下white-space可以设置的值,及其作用:一、normal作用:默认,空白会被浏览器忽略。HTML<div class="normal">这是一些文本。这是一些文本。这是一些文本。</div>_white-space;normal

CMSIS-RTOS2 文档翻译 之 参考(CMSIS-RTOS2 API 之 线程管理)_typedef void (*osthreadfunc_t) (void *argument);-程序员宅基地

文章浏览阅读6k次,点赞5次,收藏31次。线程管理CMSIS-RTOS2 API 定义,创建和控制线程函数。更多...数据结构struct osThreadAttr_t 线程的属性结构体。更多... 宏定义#define osThreadJoinable 0x00000001U 线程在可连接模式下创建。更多... #define osThreadDetached 0x00000000U 线程以分离模式创建(默认)。更多... ..._typedef void (*osthreadfunc_t) (void *argument);

随便推点

centos 解决python3.7 安装时No module named _ssl_centos 7.6 python3.8 no module named 'xml.etree-程序员宅基地

文章浏览阅读2.6k次。转载自:https://www.jianshu.com/p/3ec24f563b81_centos 7.6 python3.8 no module named 'xml.etree

Numpy/Padas/Scipy/Matplotlib/sklearn在Ubuntu16.04下的安装-程序员宅基地

文章浏览阅读149次。本文主要介绍在Ubuntu16.04下安装基于Python3的机器学习开发环境所需要的一些Python插件,具体包括常用的Numpy,Pandas,Scipy,Matplotlib,sklearn等,由于Ubuntu16.4系统默认的Python版本是python2.7.12,但是目前主流的机器学习开发环境是基于Python3的,所以本文以Python3为例,介绍机器学习开发环境的搭建,..._在虚拟环境内安装扩展库numpy、pandas、matplotlib、sklearn

ChatGPT 网络安全秘籍(一)

在不断发展的网络安全领域中,由 OpenAI 推出的 ChatGPT 所代表的生成式人工智能和大型语言模型LLMs)的出现,标志着一个重大的飞跃。本书致力于探索 ChatGPT 在网络安全领域的应用,从这个工具作为基本聊天界面的萌芽阶段开始,一直到它如今作为重塑网络安全方法论的先进平台的地位。最初构想为通过分析用户交互来辅助 AI 研究,ChatGPT 从其于 2022 年底的首次发布到如今的形态,仅一年多的时间就经历了一次非凡的演变。

ChatGPT向付费用户推“记忆”功能,可记住用户喜好 | 最新快讯

最初,只有“一小部分”用户能够使用此功能,但现在,除欧洲和韩国以外的所有ChatGPT Plus付费用户都能使用“记忆”功能。公司表示,将向ChatGPT Enterprise及ChatGPT Teams的订阅用户推出“记忆”功能,并计划将其在GPT Store商店上线,但未具体说明时间。用户可以通过查看聊天机器人从对话中提取的内容来管理ChatGPT的“记忆”,甚至可以指示ChatGPT“忘记”不再需要的细节。- 用户是一名拥有25名学生的幼儿园老师,更喜欢50分钟的课程和随后的活动。

Git Hooks的使用_git git-hocks使用-程序员宅基地

文章浏览阅读2.7k次。Git Hooks的使用1.git默认提供2.自定义hook操作(1)直接修改(2)链接自定义文件有时我们想要在git操作时候进行一些定制化操作,比如在git commit时候检查一下提交内容是否合规、git push时候检查一下资源文件大小等等,这些功能需要我们可以在git命令执行前后进行拦截,git hooks提供了这样的能力。1.git默认提供我们每个通过git管理的项目,在.git/hooks/文件夹中,会提供一些默认的git hooks文件,比如pre-commit.sample pre-p_git git-hocks使用

java钉钉微信qq扫码登录

钉钉微信qq扫码登录实现