Linux中正则表达式使用方法

时间:2020-08-09 13:13:14 Linux认证 我要投稿

Linux中正则表达式使用方法

  在Linux系统中使用grep、awk和sed命令时,需要使用正则表达式。那么正则表达式的使用方法有哪些?跟yjbys小编一起来看看吧!

  比如我通过grep找代码编译结果中是否有错误。或者是否有我代码的错误。

  这里说下正则表达式基本的应用:

  • 匹配行首与行尾。

  • 匹配数据集。

  • 只匹配字母和数字。

  • 匹配一定范围内的字符串集。

  ^ 只匹配行首

  $ 只匹配行尾

  * 一个单字符后紧跟*,匹配0个或多个此单字符

  [] 匹配[]内字符,可以是一个单字符,也可以是字符序列。可以使用 - 表示[]内字符序列范围,如用[1-5]代替[12345]

  \ 用来屏蔽一个元字符的特殊含义。因为有时在shell中一些元字符有特殊含义。\可以使其失去应有含义。

  . 匹配任意单字符

  pattern\{n\} 用来匹配前面pattern出现次数。n为次数

  pattern\{n,\} 含义同上,但次数最少为n

  patter\{n,m\} 含义同上,但pattern出现次数在n与m之间

  使用句点匹配单字符

  句点“.”可以匹配任意单字符。例如,如果要匹配一个字符串,以be g开头,中间夹一个

  任意字符,那么可以表示为be g . n,“.”可以匹配字符串头,也可以是中间任意字符。

  在ls-l命令中,可以匹配一定权限:

  .. . x . . x . . x

  此格式匹配用户本身,用户组及其他组成员的执行权限。

  ~$ ls -l |grep ...x..x..x

  drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 bin

  drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:06 emacs

  drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 etc

  drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 info

  drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 leim

  drwxrwxrwx 1 h00209633 Domain U 0 二月 7 09:05 lisp

  drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:07 site-lisp

  ~$

  在行首以^匹配字符串或字符序列

  ^只允许在一行的开始匹配字符或单词。例如,使用ls-l命令,并匹配目录。之所以可以

  这样做是因为ls-l命令结果每行第一个字符是d,即代表一个目录。

  ~$ ls -l |grep ^d

  drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 bin

  drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:06 emacs

  drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 etc

  drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 info

  drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 leim

  drwxrwxrwx 1 h00209633 Domain U 0 二月 7 09:05 lisp

  drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:07 site-lisp

  在行尾以$匹配字符串或字符

  可以说$与^正相反,它在行尾匹配字符串或字符,$符号放在匹配单词后。假定要匹配以

  单词lisp结尾的所有行,操作为:

  ~$ ls |grep sp$

  lisp

  site-lisp

  ~$

  使用*匹配字符串中的单字符或其重复序列

  使用此特殊字符匹配任意字符或字符串的重复多次表达式。例如:

  找e*m(以e开头m结束的字符串)

  ~$ ls | grep e*m

  emacs

  leim

  ~$

  使用\屏蔽一个特殊字符的`含义

  有时需要查找一些字符或字符串,而它们包含了系统指定为特殊字符的一个字符。什么

  是特殊字符?一般意义上讲,下列字符可以认为是特殊字符:

  $ . ' " * [ ] ^ | { } \ + ?

  例如:找以.el后缀的文件

  ~/lisp$ ls | grep \.el$

  abbrev.el

  abbrevlist.el

  add-log.el

  align.el

  allout.el

  ansi-color.el

  apropos.el

  arc-mode.el

  array.el

  autoarg.el

  autoinsert.el

  autorevert.el

  avoid.el

  battery.el

  bindings.el

  bookmark.el

  bs.el

  buff-menu.el

  button.el

  calculator.el

  case-table.el

  使用[]匹配一个范围或集合

  使用[]匹配特定字符串或字符串集,可以用逗号将括弧内要匹配的不同字符串分开,但并不强制要求这样做(一些系统提倡在复杂的表达式中使用逗号),这样做可以增加模式的可读性。

  使用“-”表示一个字符串范围,表明字符串范围从“-”左边字符开始,到“-”右边字符结束。

  如果熟知一个字符串匹配操作,应经常使用[]模式。

  假定要匹配任意一个数字,可以使用:

  [0123456789]

  然而,通过使用“-”符号可以简化操作:

  [0-9]

  或任意小写字母

  [a-z]

  要匹配任意字母,则使用:

  [A-Za-z]

  表明从A-Z、a-z的字母范围。

  如要匹配任意字母或数字,模式如下:

  [A-Za-z0-9]

  注意^符号的使用,当直接用在第一个括号里,意指否定或不匹配括号里内容。

  [^a-zA-Z]

  匹配任一非字母型字符,而[^0-9]匹配任一非数字型字符。

  通过最后一个例子,应可猜知除了使用^,还有一些方法用来搜索任意一个特殊字符。

  使用\{\}匹配模式结果出现的次数

  使用*可匹配所有匹配结果任意次,但如果只要指定次数,就应使用\{ \ },此模式有三种

  形式,即:

  pattern\{n\}匹配模式出现n次。

  pattern\{n,\}匹配模式出现最少n次。

  pattern\{n,m}匹配模式出现n到m次之间,n , m为0 - 2 5 5中任意整数。

  例如格式如下:前4个字符是数字,接下来是xx,最后4个也是数字,

  操作如下:

  [0-9]\{4\}XX[0-9]\{4\}

  具体含义如下:

  1)匹配数字出现4次。

  2)后跟代码xx。

  3)最后是数字出现4次。

【Linux中正则表达式使用方法】相关文章:

Linux中正则表达式与文件处理11-14

Linux认证基础知识:Linux中正则表达式与文件处理09-30

Linux认证vi编辑器的基本使用方法05-15

Linux学习中的红帽认证08-29

Linux内核中的RCU机制10-08

linux中php如何安装CURL11-23

PHP中strtotime函数使用方法11-17

日语中敬语的使用方法09-30

java程序中如何调用linux命令11-11