「正規表示式」(Regular Expression,一般簡稱 regex)是一套用來表示字串樣式(pattern)的語法,許多文字編輯器(如 ed、vim)、程式語言(如 perl、python、tcl)和應用程式(如 awk、sed、grep)都支援以正規表示式來指定要搜尋的字串。POSIX 也制定了一個標準,延伸了傳統 UNIX 的正規表示式。

用一些規則和語法來做到你所想要做的事情。舉個簡單的例子,假設今天要去買奇異果,奇異果目前有兩種:果肉黃色的和果肉綠色的,光看外表看不太出來,因此出貨的果農就在黃色果肉的奇異果上面貼著黃色的標籤,綠色奇異果則貼綠色的標籤。當我只想要買黃色果肉的奇異果時,就只要認黃色的標籤就行了。你可以把標籤當成是一種「規則」,而利用這種規則就可以找到特定的目標,因而去做進一步的動作(上面的例子則是買「黃色」果肉的奇異果)。而正規表示式就很類似上面的這個例子,概念很簡單,不過正規表示式的能力卻很強大!它可以很精確地去找到某些符合的模式(pattern)去進行某些動作。

正規表示式是非常博大精深的,有許多網路資料和書籍都涵蓋非常完整,以下只是利用簡單的例子來說明。

正規表示式的組成是由普通的字元及特殊字元(Metacharacters)組成。 普通的字元就是除了 . : | ^ [ ] { } ? % $ ! * & < > / \ + ( ) - 等的其他字元,特殊字元則是普通字元不包括的那些字元,而特殊字元都有其各自代表的意義。

外部連結

正規表示式 (last edited 2006-08-11 17:02:03 by PingYeh)