您好,登錄后才能下訂單哦!
本篇內容介紹了“Python字符串的用法”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
0. 拼接字符串
字符串的拼接操作最常用,我專門為這個話題寫過一篇《Python拼接字符串的七種方式》,建議你回看。
在此,簡單回顧一下:七種拼接方式從實現原理上劃分為三類,即格式化類(%占位符、format()、template)、拼接類(+操作符、類元祖方式、join())與插值類(f-string),在使用上,我有如下建議——
當要處理字符串列表等序列結構時,采用join()方式;拼接長度不超過20時,選用+號操作符方式;長度超過20的情況,高版本選用f-string,低版本時看情況使用format()或join()方式。
不敢說字符串就只有這七種拼接方式,但應該說它們是最常見的了。有小伙伴說,我寫漏了一種,即字符串乘法,可以重復拼接自身。沒錯,從結果上看,這是第八種拼接方式,視為補充吧。
關于字符串拼接,還得補充一個建議,即在復雜場景下,盡量避免使用以上幾類原生方法,而應該使用外置的強大的處理庫。比如在拼接 SQL 語句的時候,經常要根據不同的條件分支,來組裝不同的查詢語句,而且還得插入不同的變量值,所以當面臨這種復雜的場景時,傳統拼接方式只會加劇代碼的復雜度、降低可讀性和維護性。使用SQLAlchemy模塊,將有效解決這個問題。
1. 拆分字符串
在字符串的幾種拼接方法中,join() 方法可以將列表中的字符串元素,拼接成一個長的字符串,與此相反,split() 方法可以將長字符串拆分成一個列表。前面已說過,字符串是不可變序列,所以字符串拆分過程是在拷貝的字符串上進行,并不會改變原有字符串。
split() 方法可接收兩個參數,***個參數是分隔符,即用來分隔字符串的字符,默認是所有的空字符,包括空格、換行( )、制表符( )等。拆分過程會消耗分隔符,所以拆分結果中不包含分隔符。
s = 'Hello world' l = '''Hi there , my name is Python貓 Do you like me ? ''' # 不傳參數時,默認分隔符為所有空字符 s.split() >>> ['Hello', 'world'] s.split(' ') >>> ['Hello', 'world'] s.split(' ') >>> ['Hello world'] # 不存在兩個空格符 s.split('world') >>> ['Hello', ''] # 空字符包括空格、多個空格、換行符等 l.split() >>> ['Hi', 'there', ',', 'my', 'name', 'is', 'Python貓', 'Do', 'you', 'like', 'me', '?']
split() 方法的第二個參數是一個數字,默認是缺省,缺省時全分隔,也可以用 maxsplit 來指定拆分次數。
# 按位置傳參 l.split(' ',3) >>> ['Hi', 'there', ',', 'my name is Python 貓 Do you like me ? '] # 指定傳參 l.split(maxsplit=3) >>> ['Hi', 'there', ',', 'my name is Python 貓 Do you like me ? '] # 錯誤用法 l.split(3) --------------- TypeError Traceback (most recent call last) <ipython-input-42-6c16d1a50bca> in <module>() ----> 1 l.split(3) TypeError: must be str or None, not int
split() 方法是從左往右遍歷,與之相對,rsplit() 方法是從右往左遍歷,比較少用,但是會有奇效。
拆分字符串還有一種方法,即 splitlines() ,這個方法會按行拆分字符串,它接收一個參數 True 或 False ,分別決定換行符是否會被保留,默認值 False ,即不保留換行符。
# 默認不保留換行符 'ab c de fg kl '.splitlines() >>> ['ab c', '', 'de fg', 'kl'] 'ab c de fg kl '.splitlines(True) >>> ['ab c ', ' ', 'de fg ', 'kl ']
2. 替換字符串
替換字符串包括如下場景:大小寫替換、特定符號替換、自定義片段替換……
再次說明,字符串是不可變對象,以下操作并不會改變原有字符串。
以上這些方法都很明了,使用也簡單,建議你親自試驗一下。這里只說說 strip() 方法,它比較常用,可以去除字符串前后的空格,不僅如此,它還可以刪除首末位置的指定的字符。
s = '******Hello world******' s.strip('*') >>> 'Hello world'
3. 查找字符串
查找字符串中是否包含某些內容,這是挺常用的操作。Python 中有多種實現方式,例如內置的 find() 方法,但是這個方法并不常用,因為它僅僅告訴你所查找內容的索引位置,而在通常情況下,這個位置并不是我們的目的。
find() 方法與 index() 方法的效果一樣,它們的***的區別只在于,找不到內容時的返回值不同,一個返回 -1,一個拋出異常 :
s = 'Hello world' s.find('cat') >>> -1 s.index('cat') >>> ValueError Traceback (most recent call last) <ipython-input-55-442007c50b6f> in <module>() ----> 1 s.index('cat') ValueError: substring not found
以上兩個方法,只能用來滿足最簡單的查找需求。在實戰中,我們常常要查找特定模式的內容,例如某種格式的日期字符串,這就得借助更強大的查找工具了。正則表達式和 re 模塊就是這樣的工具,正則表達式用來定制匹配規則,re 模塊則提供了 match() 、find() 及 findall() 等方法,它們組合起來,可以實現復雜的查找功能。限于篇幅,今后再對這兩大工具做詳細介紹,這里有一個簡單的例子:
import re datepat = re.compile(r'd+/d+/d+') text = 'Today is 11/21/2018. Tomorrow is 11/22/2018.' datepat.findall(text) >>> ['11/21/2018', '11/22/2018']
4. 字符判斷
判斷字符串是否(只)包含某些字符內容,這類使用場景也很常見,例如在網站注冊時,要求用戶名只能包含英文字母和數字,那么,當校驗輸入內容時,就需要判斷它是否只包含這些字符。其它常用的判斷操作,詳列如下:
5. 字符串不可以做的事
上文內容都是 Python 字符串特有的操作方法,相信讀完之后,你更清楚知道 Python 能夠做什么了。
但是,這還不足以回答本文標題的問題——你真的知道 Python 的字符串怎么用嗎?這些特有的操作方法,再加上之前文章提到的序列共有的操作、字符串讀寫文件、字符串打印、字符串Intern機制等等內容,才差不多能夠回答這個問題。
盡管如此,為了體現嚴謹性,我試著再聊聊“Python 字符串不可以做的事”,從相反的維度來補充回答這個問題。下面是開拓思維,進行頭腦風暴的時刻:
(1)受限的序列
與典型的序列類型相比,字符串不具備列表的如下操作:append()、clear()、copy()、insert()、pop()、remove(),等等。這是為什么呢?
有幾個很好理解,即append()、insert()、pop() 和 remove(),它們都是對單個元素的操作,但是,字符串中的單個元素就是單個字符,通常沒有任何意義,我們也不會頻繁對其做增刪操作,所以,字符串沒有這幾個方法也算合理。
列表的 clear() 方法會清空列表,用來節省內存空間,效果等于anylist[:] = [],但是,奇怪的是,Python 并不支持清空/刪除操作。
首先,字符串沒有 clear() 方法,其次,它是不可變對象,不支持這種賦值操作anystr[:] = '',也不支持del anystr[:]操作:
s = 'Hello world' s[:] = '' >>> 報錯:TypeError: 'str' object does not support item assignment del s[:] >>> 報錯:TypeError: 'str' object does not support item deletion
當然,你也別想通過del s來刪除字符串,因為變量名 s 只是字符串對象的引用(挖坑,以后寫寫這個話題),只是一個標簽,刪除標簽并不會直接導致對象實體的消亡。
如此看來,想要手動清空/刪除 Python 字符串,似乎是無解。
***還有一個 copy() 方法,這就是拷貝嘛,可是字符串也沒有這個方法。為什么呢?難道拷貝字符串的場景不多么?在這點上,我也沒想出個所以然來,擱置疑問。
通過以上幾個常用列表操作的比較,我們可以看出字符串這種序列是挺受限的。列表可以看成多節車廂鏈接成的火車,而字符串感覺就只像多個座椅聯排成的長車廂,真是同源不同相啊。
(2)比就比,誰怕誰
接下來,又到了 Python 字符串與 Java 字符串 PK 的時刻。在上一篇文章《你真的了解Python的字符串嗎?》中,它們已經在對象定義的角度切磋了兩回合,勝利的天平倒向了 Python,這次看看會比出個啥結果吧。
Java 中有比較字符串的方法,即 compareTo() 方法與 equals() 方法,前一個方法逐一比較兩個字符串的字符編碼,返回一個整型的差值,后一個方法在整體上比較兩個字符串的內容是否相等。
Python 字符串沒有這兩個單獨的方法,但要實現類似的功能卻很簡便。 先看例子:
myName = "Python貓" cmpName = "world" newName = myName # 直接用比較符號進行compare myName > cmpName >>> False myName == newName >>> True cmpName != newName >>> True # 比較是否同一對象 myName is cmpName >>> False myName is newName >>> True
上例中,如果把賦值的字符串換成列表或者其它對象,這些比較操作也是可以進行的。也就是說,作比較的能力是 Python 公民們的一項基本能力,并不會因為你是字符串就給你設限,或者給你開特權。
與此類似,Python 公民們自帶求自身長度的能力,len() 方法是內置方法,可以直接傳入任意序列參數,求解長度。Java 中則要求不同的序列對象,只能調用各自的 length() 方法。說個形象的比喻,Python 中共用一把秤,三教九流之輩都能拿它稱重,而Java 中有多把秤,你稱你的,我稱我的,大家“井水不犯河水”。
Python 中曾經有 cmp() 方法和__cmp__()魔術方法,但官方嫌棄它們雞肋,所以在Python 3 中移除掉了。雖然在 operator 模塊中還為它留下了一脈香火,但保不定哪天就會徹底廢棄。
import operator operator.eq('hello', 'name') >>> False operator.eq('hello', 'hello') >>> True operator.gt('hello', 'name') >>> False operator.lt('hello', 'name') >>> True
(3)墻上的門
在 Java 中,字符串還有一個強大的 valueOf() 方法,它可以接收多種類型的參數,如boolean、char、char數組、double、float、int等等,然后返回這些參數的字符串類型。 例如,要把 int 轉為字符串,可以用 String.valueOf(anynum) 。
Python 字符串依然沒有這個單獨的方法,但要實現相同的功能卻很簡便。對Python來說,不同的數據類型轉換成字符串,那是小菜一碟,例如:
str(123) >>> '123' str(True) >>> 'True' str(1.22) >>> '1.22' str([1,2]) >>> '[1, 2]' str({'name':'python', 'sex':'male'}) >>> "{'name': 'python', 'sex': 'male'}"
而從字符串轉換為其它類型,也不難,例如,int('123') 即可由字符串'123' 得到數字 123。對比 Java,這個操作要寫成 Integer.parseInt('123')。
“Python字符串的用法”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。