中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Pandas如何實現一列數據分隔為兩列

發布時間:2020-07-23 15:42:43 來源:億速云 閱讀:683 作者:小豬 欄目:開發技術

小編這次要給大家分享的是Pandas如何實現一列數據分隔為兩列,文章內容豐富,感興趣的小伙伴可以來了解一下,希望大家閱讀完這篇文章之后能夠有所收獲。

分割成一個包含兩個元素列表的列

對于一個已知分隔符的簡單分割(例如,用破折號分割或用空格分割).str.split() 方法就足夠了 。 它在字符串的列(系列)上運行,并返回列表(系列)。

>>> import pandas as pd
>>> df = pd.DataFrame({'AB': ['A1-B1', 'A2-B2']})
>>> df

  AB
0 A1-B1
1 A2-B2
>>> df['AB_split'] = df['AB'].str.split('-')
>>> df

  AB AB_split
0 A1-B1 [A1, B1]
1 A2-B2 [A2, B2]

分割成兩列,每列包含列表的相應元素

下面來看下如何從:分割成一個包含兩個元素列表的列至分割成兩列,每列包含列表的相應元素。

>>> df['AB'].str[0]

0 A
1 A
Name: AB, dtype: object

>>> df['AB'].str[1]

0 1
1 2
Name: AB, dtype: object

因此可以得到

>>> df['AB'].str.split('-', 1).str[0]

0 A1
1 A2
Name: AB, dtype: object

>>> df['AB'].str.split('-', 1).str[1]

0 B1
1 B2
Name: AB, dtype: object

可以通過如下代碼將pandas的一列分成兩列:

>>> df['A'], df['B'] = df['AB'].str.split('-', 1).str
>>> df

  AB AB_split A B
0 A1-B1 [A1, B1] A1 B1
1 A2-B2 [A2, B2] A2 B2

補充知識:pandas某一列中每一行拆分成多行的方法

在處理數據過程中,常會遇到將一條數據拆分成多條,比如一個人的地址信息中,可能有多條地址,既有家庭地址也有工作地址,還有電話信息等等類似的情況,實際使用數據的時候又需要分開處理,這個時候就需要將這一條數據進行拆分成多條,以方便使用。

在pandas中如何對DataFrame進行相關操作呢,經查閱相關資料,發現了一個簡單的辦法,

info.drop(['city'], axis=1).join(info['city'].str.split(' ', expand=True).stack().reset_index(level=1, drop=True).rename('city'))

看起來非常之長,分開來看,流程如下:

將需要拆分的數據使用split拆分工具拆分,并使用expand功能拆分成多列

將拆分后的多列數據進行列轉行操作(stack),合并成一列

將生成的復合索引重新進行reset保留原始的索引,并命名

將上面處理后的DataFrame和原始DataFrame進行join操作,默認使用的是索引進行連接

具體操作如下:

預操作:生成需要使用的DataFrame

# 用來生成DataFrame的工具
from pydbgen import pydbgen
myDB=pydbgen.pydb()

# 生成一個DataFrame
info = myDB.gen_dataframe(10,['name','phone','city','state'])

結果如下:

namephone-numbercitystate
0Hannah Richard810-859-7815IrwinvilleLouisiana
1Ronald Berry591-564-0585Glen EllenMinnesota
2Caitlin Barron969-840-8580DuboisOklahoma
3Felicia Stephens154-858-1233VeedersburgAlaska
4Shelly Dennis343-104-9365MattapexVirginia
5Nicholas Hill992-239-1954MonetaMinnesota
6Steve Bradshaw164-081-7811Ten BroeckColorado
7Gail Johnston155-259-9514WayanVirginia
8John Gray409-892-4716DarlingtonPennsylvania
9Katherine Bautista185-861-1677McNabTexas

假如現在我們要對city列進行進行拆分,按照空格拆分,轉換成多行的數據,
第一步:拆分,生成多列

info_city = info['city'].str.split(' ', expand=True)

結果如下:

01
0IrwinvilleNone
1GlenEllen
2DuboisNone
3VeedersburgNone
4MattapexNone
5MonetaNone
6TenBroeck
7WayanNone
8DarlingtonNone
9McNabNone

可以看到已經將原始數據拆分成了2列,對于無法拆分的數據為None

第二步:行轉列

info_city = info_city.stack()

結果如下:

00Irwinville
10Glen
1Ellen
20Dubois
30Veedersburg
40Mattapex
50Moneta
60Ten
1Broeck
70Wayan
80Darlington
90McNab

其中前面兩列是索引,返回的是一個series,沒有名字的series

第三步:重置索引,并命名(并刪除多于的索引)

info_city = info_city.reset_index(level=1, drop=True)

結果如下:

0Irwinville
1Glen
1Ellen
2Dubois
3Veedersburg
4Mattapex
5Moneta
6Ten
6Broeck
7Wayan
8Darlington
9McNab

第四步:和原始數據合并

info_new = info.drop(['city'], axis=1).join(info_city)

結果如下:

namephone-numberstatecity
0Hannah Richard810-859-7815LouisianaIrwinville
1Ronald Berry591-564-0585MinnesotaGlen
1Ronald Berry591-564-0585MinnesotaEllen
2Caitlin Barron969-840-8580OklahomaDubois
3Felicia Stephens154-858-1233AlaskaVeedersburg
4Shelly Dennis343-104-9365VirginiaMattapex
5Nicholas Hill992-239-1954MinnesotaMoneta
6Steve Bradshaw164-081-7811ColoradoTen
6Steve Bradshaw164-081-7811ColoradoBroeck
7Gail Johnston155-259-9514VirginiaWayan
8John Gray409-892-4716PennsylvaniaDarlington
9Katherine Bautista185-861-1677TexasMcNab

需要特別注意的是,需要使用原始的連接新生成的,因為新生成的是一個series沒有join方法,也可以通過將生成的series通過to_frame方法轉換成DataFrame,這樣就沒有什么差異了

寫了這么多,記住下面的就行了:

info.drop([‘city'], axis=1).join(info[‘city'].str.split(' ', expand=True).stack().reset_index(level=1, drop=True).rename(‘city'))

如果原數據中已經是list了,可以將info[‘city'].str.split(' ', expand=True)這部分替換成info[‘city'].apply(lambda x: pd.Series(x)),就可以達到相同的目的。

看完這篇關于Pandas如何實現一列數據分隔為兩列的文章,如果覺得文章內容寫得不錯的話,可以把它分享出去給更多人看到。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

鹤庆县| 河源市| 若羌县| 日土县| 曲松县| 南木林县| 临潭县| 洛隆县| 滁州市| 长泰县| 柳林县| 定西市| 陈巴尔虎旗| 江达县| 拉孜县| 行唐县| 辽宁省| 漳浦县| 海安县| 龙岩市| 射阳县| 盖州市| 新宾| 日土县| 新兴县| 登封市| 乐安县| 宜阳县| 平安县| 临沭县| 扎鲁特旗| 民乐县| 资中县| 永春县| 右玉县| 竹山县| 锡林浩特市| 马边| 抚松县| 玉溪市| 海原县|