您好,登錄后才能下訂單哦!
今天就跟大家聊聊有關PHP中如何使用preg_match_all正則表達式,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。
實例代碼:
$html = '<div id="biuuu">51CTO</div><div id="biuuu_2">51CTO2</div><div id="biuuu_3">51CTO3</div>'; |
實例要求:分別將每一個DIV元素的ID和內容取出,如biuuu,biuuu_2,biuuu_3,51CTO,51CTO2和51CTO3(一些常用的抓站方法就是這樣匹配的)
分析:字符串是一個簡單的HTML元素,每一個DIV元素對應該一個ID和內容,并且是獨立的,首先考慮如何取出一個DIV內的ID值和內容,如:51CTO,然后匹配其它類似的元素。一個DIV中需要取出兩個值,也就是兩個匹配的表達式,***個表達式用于匹配ID值(biuuu),第二個表達式用于匹配ID的內容(51CTO),正則表達式常用的表達式使用小括號,那么前面的元素將會變成如下形式:
<div id="(biuuu)">(51CTO)</div> <div id="(表達式1)">(表達式2)</div> |
好,使用如上小括號把需要匹配的區域進行了劃分,接下來就是如何匹配各個表達式內的內容,我們猜想一個ID可能是字母,數字或下劃線,那這就變得簡單了,使用中括號就可以實現,如下:
表達式1:[a-zA-Z0-9_]+ (表示匹配大小寫字母,數字和下劃線)
那如何匹配表達式2,因為ID的內容可以是任意的字符,但是要注意,不能匹配<或>字符,因為如果匹配這兩個字符將會把后面使用的DIV都匹配出來,因此需要排除這兩個字符開始的元素,也就是不匹配以<或>字符,如下:
表達式2:[^<>]+ (表示不匹配<和>字符)
這樣,需要匹配的子表達式就實現了,但是還要需要匹配一個的表達式,方法如下:
表達式:/ '\"(表達式1)\"'>(表達式2)<\/div>/
注意其中的雙引號"和/需要使用\轉義字符轉義,然后把前面兩個表達式放進去,如下:
'\"([a-z0-9_]+)\"'>/<div id=\"([a-z0-9_]+)\">([^<>]+)<\/div>/
這樣就實現一個匹配每一個DIV元素ID值和內容的正則表達式,然后使用preg_match_all函數測試如下: $html = '<div id="biuuu">51CTO</div><div id="biuuu_2">51CTO2</div><div id="biuuu_3">51CTO3</div>'; preg_match_all('/<div\sid=\"([a-z0-9_]+)\">([^<>]+)<\/div>/',$html,$result); var_dump($result); |
結果:
array(3) { [0]=> array(3) { [0]=> string(30) "<div id="biuuu">51CTO</div>" [1]=> string(33) "<div id="biuuu_2">51CTO2</div>" [2]=> string(33) "<div id="biuuu_3">51CTO3</div>" } [1]=> array(3) { [0]=> string(5) "biuuu" [1]=> string(7) "biuuu_2" [2]=> string(7) "biuuu_3" } [2]=> array(3) { [0]=> string(8) "51CTO" [1]=> string(9) "51CTO2" [2]=> string(9) "51CTO3" } } |
看完上述內容,你們對PHP中如何使用preg_match_all正則表達式有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注億速云行業資訊頻道,感謝大家的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。