使用正則表達式時,利用好其預編譯功能,可以有效加快正則匹配速度。
正則表達式,又稱規(guī)則表達式,(Regular Expression,在代碼中常簡寫為regex、regexp或RE),是一種文本模式,包括普通字符(例如,a到z之間的字母)和特殊字符(稱為"元字符"),是計算機科學的一個概念。使用正則表達式時,利用好其預編譯功能,可以有效加快正則匹配速度。
預編譯是做些代碼文本的替換工作。處理以#開頭的指令,比如拷貝#include包含的文件代碼,#define宏定義的替換,條件編譯等,就是為編譯做的預備工作的階段。主要處理#開始的預編譯指令,預編譯指令指示了在程序正式編譯前就由編譯器進行的操作,可以放在程序中的任何位置。C編譯系統(tǒng)在對程序進行通常的編譯之前,首先進行預處理。
正則表達式的特點
1、靈活性、邏輯性和功能性非常強。
2、可以迅速地用極簡單的方式達到字符串的復雜控制。
3、對于剛接觸的人來說,比較晦澀難懂。
由于正則表達式主要應用對象是文本,因此它在各種文本編輯器場合都有應用,小到著名編輯器EditPlus,大到Microsoft Word、Visual Studio等大型編輯器,都可以使用正則表達式來處理文本內(nèi)容。判斷給定的字符串是否符合正則表達式的過濾邏輯(稱作“匹配”),可以通過正則表達式,從字符串中獲取我們想要的特定部分。