您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關正則表達式引擎的內部工作機制是什么的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
了解正則表達式引擎的必要性:
知道正則表達式引擎是如何工作的有助于你很快理解為何某個正則表達式不像你期望的那樣工作。
正則表達式引擎的種類:
有兩種類型的引擎:文本導向(text-directed)的引擎和正則導向(regex-directed)的引擎。Jeffrey Friedl把他們稱作DFA和NFA引擎。本文談到的是正則導向的引擎。這是因為一些非常有用的特性,如“惰性”量詞(lazy quantifiers)和反向引用(backreferences),只能在正則導向的引擎中實現。所以毫不意外這種引擎是目前***的引擎。
你可以輕易分辨出所使用的引擎是文本導向還是正則導向。如果反向引用或“惰性”量詞被實現,則可以肯定你使用的引擎是正則導向的。你可以作如下測試:將正則表達式<<regex|regex not>>應用到字符串“regex not”。如果匹配的結果是regex,則引擎是正則導向的。如果結果是regex not,則是文本導向的。因為正則導向的引擎是“猴急”的,它會很急切的進行表功,報告它找到的***個匹配 。
正則表達式引擎的小小總結:
正則導向的引擎總是返回最左邊的匹配,這是需要你理解的很重要的一點:即使以后有可能發現一個“更好”的匹配,正則導向的引擎也總是返回最左邊的匹配。
當把<<cat>>應用到“He captured a catfish for his cat”,引擎先比較<<c>>和“H”,結果失敗了。于是引擎再比較<<c>>和“e”,也失敗了。直到第四個字符,<<c>>匹配了“c”。<<a>>匹配了第五個字符。到第六個字符<<t>>沒能匹配“p”,也失敗了。引擎再繼續從第五個字符重新檢查匹配性。直到第十五個字符開始,<<cat>>匹配上了“catfish”中的“cat”,正則表達式引擎急切的返回***個匹配的結果,而不會再繼續查找是否有其他更好的匹配。
感謝各位的閱讀!關于“正則表達式引擎的內部工作機制是什么”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。