shell模糊匹配与正则详解-迪思分享

本站所有内容来自互联网收集，仅供学习和交流，请勿用于商业用途。如有侵权、不妥之处，请第一时间联系我们删除！Q群：

免费资源网 – https://freexyz.cn/

前言：

正则可以实现一些简单的功能，并用在脚本中，如检测ip地址是否符合规范，检测文件名是否符合规范等等。

正则表达式

正则表达式主要是用来描述一个句法规则的模式。其实说的通俗一点，就是利用字符和元字符的组合，对一些符合既定句法的模式进行模糊匹配。它的主要功能是文本查询和字符串操作。

正则表达式的基本元素包括普通字符和元字符，在Linux shell里面，常用的正则表达式元字符集为：S={* . ^ $ [] &; &;&; {} {n,} {n,m} },每一个元字符都有自己在正则表达式中的含义，下面来介绍一下：

“ * ”符号：表示匹配前面一个普通字符0次或多次。注意这里是一个普通字符，即如果是JO*B的话，那么*就匹配字符“O”任意次，而不是匹配“JO”串。

“ . ”符号：表示匹配任意一个字符。字符“ . “就表示一个字符，这个字符可以是任意字符。例如字符串 …73 就表示前面3个字符为任意字符(包括空格)，第4个和第5个字符分别是7和3。

“ ^ ”符号：表示匹配行首。例如：^cloud就表示匹配以cloud字符串开头的所有行。与上面匹配一个字符不一样，这里匹配的是后面跟着的整个字符串。

” $ “符号：表示匹配行尾。例如：cloud$ 就表示匹配以cloud字符串结尾的所有行。结合上面的匹配行首，^$表示匹配空行。

“ [] “符号：表示匹配方括号里面的字符集中的一个。例如：数字0-9中的任意一个数字都满足[0-9]这个表达式。值得注意的是，当^放在[]里面的时候，^就不再表示行首，而是表示取反。如：[^7-9]则表示非7-9中的任意一个数字才满足这个表达式。

” “符号：是转义字符。如果你写的正则表达式里面包括元字符，而你又想将它当做普通字符用的话，就要在前面加上转义符号” “了。例如：$就表示一个普通字符”$”。

“&;&;”符号：表示精确匹配<>内的字符，” “是用来转义<>这两个字符的。例如：&;the&;表示匹配包含”the“的行，由于精确匹配，所以，”them“，”theory“这些单词所在的行并不会被匹配到。

”{}”符号：与” * “类似，表示匹配前面的一个字符任意多次。但是“{}”可以指定重复的次数，如{3}则表示重复前面的字符3次；{3,}表示重复前面的字符至少3次；{3,5}表示重复3到5次。例如：JO{3}B则表示重复字符O三次，即JOOOB；JO{3,}B则表示至少重复O三次，即JOOOB，JOOOOB等都符合；{3,5}则匹配JOOOB，JOOOOB，JOOOOOB这几个字符串。

通配符

初学的时候对于正则表达式和通配符的理解很模糊，两个都是可以进行模糊匹配的，到底什么时候用才是正则表达式，什么时候用是通配符呢？其实，我们登录系统之后，系统的bash shell并不支持正则表达式的，也就是说，我们如果使用bash shell的某些命令时使用正则表达式，shell可能会认不出来，只有当我们使用类似grep，sed，awk等工具的时候才有效。所以，我们在使用bash shell的时候也想达到模糊匹配的目的的话，就要使用通配符了。

通配符是使用正则表达式的一些元字符来的，常用的元字符集：E={? * [] {} ^ }。不过，这个通配符的元字符意义跟正则表达式里面的不太一样。例如：

“ * “字符不再表示匹配前面一个字符任意多次，而是表示任意位置的任意字符。例如：phi*ip，则可以匹配philip，phillip，philsaip等开始三个是phi和结尾两位是ip的任意字符。例如ls -l *.awk表示匹配以.awk结尾的所有文件，*表示任意长度任意字符组合。

” ? ”字符才表示任意一个字符。同正则表达式元字符的” . “

” {} “字符不需要转义。在{}表示的是表达式集合。如：ls -l {[a-h]*.awk,0?.pem}则表示列出所有以a-h字符开头的.awk文件的和以0开头，后面接一个任意字符的.pem文件

” ^ “字符也不是表示行首，而是代表取反。

正则表达式和通配的应用环境上有些不一样，但是都能够达到模糊匹配的效果。在后面介绍到的使用grep，sed和awk等工具对于文件的查找以及各种操作中，正则表达式的匹配作用更加明显。

范例：

检测文件名是否符合规范：

#!/bin/bash RED=33[31m GREEN=33[32m awk {printf(“%s”,$0)} $1 | egrep “^#[[:digit:]]*-(docs|unittest|pseudocode|msg-[^ ].*)$” > /dev/null 2>&1 if [ $? -ne 0 ];then echo -e “message check ${RED}fail${NORMAL}” exit 1 fi echo -e “message check ${GREEN}success${NORMAL}” exit 0

当然，也可以使用if，如：

if [[ $1 =~ ^[0-9]+$ ]]; then echo “Is Number.” else echo “No Number.” fi

检测ip地址是否符合规范：

构造测试文件 ip.txt

10.1.1.1 192.168.0.1 192.168.0.101 255.255.255.255 999.0.0.1 1.0.0.500 a.0.0.0 0.b.0.0 1.1.1 2.2 1 0.0.0.0

基本思路就是要每个点之间的元素为整数，最多为3位整数[0-9]{1,3}，然后用 . 拼接起来，加上^和$更精确的限制匹配对象

cat ip.txt |grep ^[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}$

结果为

10.1.1.1 192.168.0.1 192.168.0.101 255.255.255.255 999.0.0.1 1.0.0.500 0.0.0.0

这里精度不够，需要严格限制整数为1-255（第一个元素不能为0，后面的可以为0），即0-9 10-99 100-199 200-249 250-255

([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5]) 注意|和()转义，另外|分割的元素要用（）括住,若带-E参数指定为扩展正则的形式则不需用转义

然后后面3个元素只要稍改下范围到0-255，简单的拼接起来

代码如下:cat ip.txt |grep ^([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5]).([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5]).([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5]).([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])$

结果如下

10.1.1.1

192.168.0.1

192.168.0.101

255.255.255.255

当然更简洁的写法,记得.后面的元要()括起来

代码如下:cat ip.txt |grep ^([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])(.([0-9]|([1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])){3}$

免费资源网 – https://freexyz.cn/

迪思分享版权声明 ① 本网站名称：❤迪思分享❤ 本站永久网址：▶https://www.dsary.com◀
② 如果您喜欢本站，点击这儿

开通VIP，同时按Ctrl+D保存网页
③ 在浏览网站中可能会帮助到您：

④ 本站接受投稿，同时也开启了创作分成，投稿用户只需自行设置收费即可！点击查看如果需要投稿，请点击投稿发布文章！
⑤ 本站一律禁止以任何方式发布或转载任何违法的相关信息，如果发现请点击上方联系方式进行举报！情况如实，可获得本站一个月的VIP
⑥ 本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。如遇压缩包需解压密码，一般为：www.dsary.com 丨 www.syymw.com请知悉！
⑦ 修改版本安卓及电脑软件，加群提示为修改者自留，非本站信息，注意鉴别！资源来源于网络，仅供大家学习与参考，请于下载后24小时内删除；
⑧ 若作商业用途，请联系原作者授权，若本站侵犯了您的权益请联系站长进行删除处理；可联系上方QQ或进入QQ群进行反馈！
⑨互联网的本质是自由与分享，我们真诚的希望，每一份有价值的正能量能够在互联网中自由传播。

THE END

编程教程

shell模糊匹配与正则详解

请登录后发表评论