Linux中正則表達式使用方法

學識都 人氣:7.68K

在Linux系統中使用grep、awk和sed命令時,需要使用正則表達式。那麼正則表達式的使用方法有哪些?跟本站小編一起來看看吧!

比如我通過grep找代碼編譯結果中是否有錯誤。或者是否有我代碼的錯誤。

這裏說下正則表達式基本的應用:

• 匹配行首與行尾。

• 匹配數據集。

• 只匹配字母和數字。

• 匹配一定範圍內的字符串集。

^ 只匹配行首

$ 只匹配行尾

* 一個單字符後緊跟*,匹配0個或多個此單字符

[] 匹配[]內字符,可以是一個單字符,也可以是字符序列。可以使用 - 表示[]內字符序列範圍,如用[1-5]代替[12345]

用來屏蔽一個元字符的特殊含義。因爲有時在shell中一些元字符有特殊含義。可以使其失去應有含義。

. 匹配任意單字符

pattern{n} 用來匹配前面pattern出現次數。n爲次數

pattern{n,} 含義同上,但次數最少爲n

patter{n,m} 含義同上,但pattern出現次數在n與m之間

使用句點匹配單字符

句點“.”可以匹配任意單字符。例如,如果要匹配一個字符串,以be g開頭,中間夾一個

任意字符,那麼可以表示爲be g . n,“.”可以匹配字符串頭,也可以是中間任意字符。

在ls-l命令中,可以匹配一定權限:

.. . x . . x . . x

此格式匹配用戶本身,用戶組及其他組成員的執行權限。

~$ ls -l |grep ...x..x..x

drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 bin

drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:06 emacs

drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 etc

drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 info

drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 leim

drwxrwxrwx 1 h00209633 Domain U 0 二月 7 09:05 lisp

drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:07 site-lisp

~$

在行首以^匹配字符串或字符序列

^只允許在一行的開始匹配字符或單詞。例如,使用ls-l命令,並匹配目錄。之所以可以

這樣做是因爲ls-l命令結果每行第一個字符是d,即代表一個目錄。

~$ ls -l |grep ^d

drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 bin

drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:06 emacs

drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 etc

drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 info

drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 leim

drwxrwxrwx 1 h00209633 Domain U 0 二月 7 09:05 lisp

drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:07 site-lisp

在行尾以$匹配字符串或字符

可以說$與^正相反,它在行尾匹配字符串或字符,$符號放在匹配單詞後。假定要匹配以

單詞lisp結尾的所有行,操作爲:

~$ ls |grep sp$

lisp

site-lisp

~$

使用*匹配字符串中的單字符或其重複序列

使用此特殊字符匹配任意字符或字符串的重複多次表達式。例如:

找e*m(以e開頭m結束的字符串)

~$ ls | grep e*m

emacs

leim

~$

使用屏蔽一個特殊字符的`含義

有時需要查找一些字符或字符串,而它們包含了系統指定爲特殊字符的一個字符。什麼

是特殊字符?一般意義上講,下列字符可以認爲是特殊字符:

$ . ' " * [ ] ^ | { } + ?

例如:找以後綴的文件

~/lisp$ ls | grep $

使用[]匹配一個範圍或集合

使用[]匹配特定字符串或字符串集,可以用逗號將括弧內要匹配的不同字符串分開,但並不強制要求這樣做(一些系統提倡在複雜的表達式中使用逗號),這樣做可以增加模式的可讀性。

使用“-”表示一個字符串範圍,表明字符串範圍從“-”左邊字符開始,到“-”右邊字符結束。

如果熟知一個字符串匹配操作,應經常使用[]模式。

假定要匹配任意一個數字,可以使用:

[0123456789]

然而,通過使用“-”符號可以簡化操作:

[0-9]

或任意小寫字母

[a-z]

要匹配任意字母,則使用:

[A-Za-z]

表明從A-Z、a-z的字母範圍。

如要匹配任意字母或數字,模式如下:

[A-Za-z0-9]

注意^符號的使用,當直接用在第一個括號裏,意指否定或不匹配括號裏內容。

[^a-zA-Z]

匹配任一非字母型字符,而[^0-9]匹配任一非數字型字符。

通過最後一個例子,應可猜知除了使用^,還有一些方法用來搜索任意一個特殊字符。

使用{}匹配模式結果出現的次數

使用*可匹配所有匹配結果任意次,但如果只要指定次數,就應使用{ },此模式有三種

形式,即:

pattern{n}匹配模式出現n次。

pattern{n,}匹配模式出現最少n次。

pattern{n,m}匹配模式出現n到m次之間,n , m爲0 - 2 5 5中任意整數。

例如格式如下:前4個字符是數字,接下來是xx,最後4個也是數字,

操作如下:

[0-9]{4}XX[0-9]{4}

具體含義如下:

1)匹配數字出現4次。

2)後跟代碼xx。

3)最後是數字出現4次。