中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python怎么通過正則匹配指定字符開頭與結束提取中間內容

發布時間:2023-02-24 17:20:08 來源:億速云 閱讀:96 作者:iii 欄目:開發技術

本文小編為大家詳細介紹“python怎么通過正則匹配指定字符開頭與結束提取中間內容”,內容詳細,步驟清晰,細節處理妥當,希望這篇“python怎么通過正則匹配指定字符開頭與結束提取中間內容”文章能幫助大家解決疑惑,下面跟著小編的思路慢慢深入,一起來學習新知識吧。

一、提取包含始末字符

1、起始字符串固定

a = re.findall('起始字符串.*結束字符串',str)

2、起始字符串不固定(即從首字符串提取到固定的字符串結束),用^指定從首字符串開始

a = re.findall('^.*結束字符串',str)

二、不包含始末字符串

#方法1
a = re.findall('(?<=始字符串).*?(?=末字符串)',str)
#方法2
a = re.findall('始字符串(.*?)末字符串',str)

在 re.findall()的方法中 '始字符串.末字符串&rsquo; 可以匹配到相同的值直到最后一個值;如果參數為 '始字符串.?末字符串&rsquo;則只匹配到第一個值。其實使用.*和.+都能提取特定始末字符串中間的內容,下面順便說下兩者的區別。

三、.*和.+正則提取的區別

.:匹配任意字符
*:匹配0個或多個字符
?:非貪婪模式,在符合的條件下,盡可能少的匹配(盡可能短的匹配)

str2 = "aabab"
a = re.findall('a.*?b',str2)	#結果:['aab', 'ab']
b = re.findall('a.+?b',str2)	#結果:['aab']

.?:匹配aab和ab ,因為可以匹配0個字符,所以可以匹配得到ab
.+?:匹配aab,因為+必須a和b中間至少有一個字符,所以排除了ab

四、起始有無^的區別

str2 = "aabab"
c = re.findall('.*',str2)	#結果:['aabab', '']
d = re.findall('^.*',str2)	#結果:['aabab']

五、pandas對具體列的內容通過正則表達式進行數據提取

1.使用前要確保該列的類型統一,str或者float格式,最好事先通過astype強制轉換一下

2.df[&lsquo;新列名&rsquo;]=df[&lsquo;提取的列名&rsquo;].str.extract(&lsquo;正則表達式&rsquo;, expand = True)

六、遇到的報錯

報錯:pattern contains no capture groups
(翻譯:模式不包含捕獲組)
解決:根據docs ,您需要為 str.extract 指定一個捕獲組(即括號)好,提取。

讀到這里,這篇“python怎么通過正則匹配指定字符開頭與結束提取中間內容”文章已經介紹完畢,想要掌握這篇文章的知識點還需要大家自己動手實踐使用過才能領會,如果想了解更多相關內容的文章,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

洪江市| 温泉县| 左贡县| 宣恩县| 丰县| 汉源县| 烟台市| 唐山市| 西畴县| 法库县| 芜湖县| 清丰县| 新兴县| 措美县| 读书| 车致| 鄂尔多斯市| 丰顺县| 遵义市| 成都市| 水富县| 永仁县| 阳朔县| 温州市| 隆尧县| 基隆市| 琼结县| 东兰县| 灯塔市| 富蕴县| 灵山县| 东乌珠穆沁旗| 平顶山市| 平顺县| 洪雅县| 高清| 乌海市| 砚山县| 策勒县| 廉江市| 独山县|