go語言正則表達式怎么用

發布時間：2021-11-20 16:02:37 來源：億速云閱讀：308 作者：小新欄目：軟件技術

小編給大家分享一下go語言正則表達式怎么用，相信大部分人都還不怎么了解，因此分享這篇文章給大家參考一下，希望大家閱讀完這篇文章后大有收獲，下面讓我們一起去了解一下吧！

正則表達式處理使用到的庫

regexp

使用到regexp庫函數有

MustCompile 和 Compile

MustCompile 的作用和 Compile 一樣,    將正則表達式編譯成一個正則對象（使用 PERL 語法）。
該正則對象會采用“leftmost-first”模式。選擇第一個匹配結果.如果正則表達式語法錯誤，則返
回錯誤信息。不同的是，當正則表達式 str 不合法時，MustCompile 會拋出異常,而 Compile 僅返回一個 error 值

FindString

返回匹配上正則表達式最左邊的一個字符串，如果沒有匹配上會返回空字符串

實踐

例1 獲取下面文本中的company（公司名稱）、address（地址）、telephone（電話）

         <ul class="t3">     
              <li class="company">山東東阿阿膠股份有限公司</li>
              <li class="address">山東省東阿縣阿膠街78號</li>
               <li class="telephone">0635-3262315</li>

    </ul>

正則表達式

        <li class="company">(.+)</li>
        <li class="company">(.+)</li>
        <li class="telephone">(.+)</li>

代碼實現

    package ...
    import (
        ...
        "regexp"
        ...
    )
    ...

    var (
        company          = regexp.MustCompile(`<li class="company">(.+)</li>`)
        address          = regexp.MustCompile(`<li class="address">(.+)</li>`)
        telephone        = regexp.MustCompile(`<li class="telephone">(.+)</li>`)
        )

    var (
        respBody = ` 
                <ul class="t3">
                    <li class="company">山東東阿阿膠股份有限公司</li>
                    <li class="address">山東省東阿縣阿膠街78號</li>
                    <li class="telephone">0635-3262315</li>
                </ul>`
    )

companyMatches := company.FindString(respBody)
companyRst := strings.TrimSpace(strings.Trim(strings.Trim(companyMatches,`<li class="company">`),`</`))  

addressMatches := address.FindString(respBody)
addre***st := strings.TrimSpace(strings.Trim(strings.Trim(addressMatches,`<li class="address">`),`</`))

telephoneMatches := telephone.FindString(respBody)
telephoneRst := strings.TrimSpace(strings.Trim(strings.Trim(telephoneMatches,`<li class="telephone">`),`</`))

講解：

其中正則表達式   `<li class="company">(.+)</li>`  的意思是匹配以<li class="company">開頭，以</li>結尾，中間匹配一次或多次除換行符之外的任何字符

'.' 匹配除換行符（\n、\r）之外的任何單個字符。要匹配包括 '\n' 在內的任何字符，請使用像"(.|\n)"的模式。

'+' 匹配前面的子表達式一次或多次。例如，'zo+' 能匹配 "zo" 以及 "zoo"，但不能匹配 "z"。+ 等價于 {1,}。

例2 將HTML標簽全轉換成小寫

re, _ := regexp.Compile("\\<[\\S\\s]+?\\>")或者
    re, _ = regexp.Compile(`\<[\S\s]+?\>`)
respBody = re.ReplaceAllStringFunc(respBody, strings.ToLower)

講解：

    匹配以'<'開頭，以’\>‘結尾，中間匹配一個或多個任意字符，而且盡可能少的匹配所搜索到的字符，因為?標示非貪婪模式

    舉個例子：
            正則表達式`\<[\S\s]+?\>處理下面字符串 ’<test1\> nice<test2\>‘，返回結果’<test1\>‘
            而正則表達式`\<[\S\s]+\>處理下面字符串 ’<test1\> nice<test2\>‘，返回接’<test1\> nice<test2\>‘

？當該字符緊跟在任何一個其他限制符 (*, +, ?, {n}, {n,}, {n,m}) 后面時，匹配模式是非貪婪的。非貪婪模式盡可能少的匹配所搜索的字符串，而默認的貪婪模式則盡可能多的匹配所搜索的字符串。例如，對于字符串 "oooo"，'o+?' 將匹配單個 "o"，而 'o+' 將匹配所有 'o'。
\s  匹配任何空白字符，包括空格、制表符、換頁符等等。等價于 [ \f\n\r\t\v]。
\S  匹配任何非空白字符。等價于 [^ \f\n\r\t\v]。

例3 去除STYLE

re, _ = regexp.Compile("\\<style[\\S\\s]+?\\</style\\>")或者
    re, _ = regexp.Compile(`\<style[\S\s]+?\</style\>`)
respBody = re.ReplaceAllString(respBody, "")

講解：
同例2

例4 去除SCRIPT

re, _ = regexp.Compile("\\<script[\\S\\s]+?\\</script\\>") 或者
    re, _ = regexp.Compile(`\<script[\S\s]+?\</script\>`)
respBody = re.ReplaceAllString(respBody, "")

講解：
同例3

例5 去除所有尖括號內的HTML代碼，并換成換行符

re, _ = regexp.Compile("\\<[\\S\\s]+?\\>")
respBody = re.ReplaceAllString(respBody, "\n")

講解：
同例3

例6 去除連續的換行符

re, _ = regexp.Compile("\\s{1,}")
respBody = re.ReplaceAllString(respBody, "\n")

講解：

{n,}  n 是一個非負整數。至少匹配n 次。例如，'o{2,}' 不能匹配 "Bob" 中的 'o'，但能匹配 "foooood" 中的所有 o。'o{1,}' 等價于 'o+'。'o{0,}' 則等價于 'o*'。

例7 查找下面尾頁數字15

<a  target='_self' href='/search/不孕癥-p15/' class='last'>尾頁</a>

代碼：

allPage       = regexp.MustCompile(`<a  target='_self' href='/search/[.\x{4e00}-\x{9fa5}0-9]+-p[0-9]/'[ ]*class='last'>尾頁</a>`)
allPagePrefix = regexp.MustCompile(`<a  target='_self' href='/search/[.\x{4e00}-\x{9fa5}0-9]+-p`)
allPageSuffix = regexp.MustCompile(`/'[ ]*class='last'>\x{5c3e}\x{9875}</a>`)

numPage = allPage.FindString(body)
numPage = allPagePrefix.ReplaceAllString(numPage, "")
numPage = allPageSuffix.ReplaceAllString(numPage, "")

匹配詳解：
正則表達式<a target='_self' href='/search/[.\x{4e00}-\x{9fa5}0-9]+-p[0-9]/'[ ]*class='last'>尾頁</a>：

    匹配以"<a  target='_self' href='/search/"開頭，以class='last'>尾頁</a>結尾，中間匹配若干個除換行外的任意字符或者中文字符

以上是“go語言正則表達式怎么用”這篇文章的所有內容，感謝各位的閱讀！相信大家都有了一定的了解，希望分享的內容對大家有所幫助，如果還想學習更多知識，歡迎關注億速云行業資訊頻道！

向AI問一下細節

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

go語言正則表達式怎么用

正則表達式處理使用到的庫

使用到regexp庫函數有

MustCompile 和 Compile

FindString

實踐

例1 獲取下面文本中的company（公司名稱）、address（地址）、telephone（電話）

例2 將HTML標簽全轉換成小寫

例3 去除STYLE

例4 去除SCRIPT

例5 去除所有尖括號內的HTML代碼，并換成換行符

例6 去除連續的換行符

例7 查找下面尾頁數字15

猜你喜歡

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

go語言正則表達式怎么用

正則表達式處理使用到的庫

使用到regexp庫函數有

MustCompile 和 Compile

FindString

實踐

例1 獲取下面文本中的company（公司名稱）、address（地址）、telephone（電話）

例2 將HTML標簽全轉換成小寫

例3 去除STYLE

例4 去除SCRIPT

例5 去除所有尖括號內的HTML代碼，并換成換行符

例6 去除連續的換行符

例7 查找下面尾頁數字15

猜你喜歡

最新資訊

相關推薦

相關標簽