您好,登錄后才能下訂單哦!
這篇文章主要講解了“Pandas怎么實現分組”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“Pandas怎么實現分組”吧!
創建測試數據框
import pandas as pd df = pd.DataFrame({'a': [1, 2, 3, 4], 'b': [5, 6, 7,8],'c': ['x', 'y', 'x','y'],'d':["one","two","three","two"]}) print(df) a b c d0 1 5 x one1 2 6 y two2 3 7 x three3 4 8 y two
計算以c列分組的,每組的平均值,非數值列將會被自動忽略
print(df.groupby(df["c"]).mean()) a bc x 2 6 y 3 7
多列分組
gb=df.groupby([df["c"],df["d"]]) print(gb) <pandas.core.groupby.DataFrameGroupBy object at 0x0000000004A1DEB8>#groupby存儲的是分組信息,而不是分組的數據 for i,j in gb: print(i) print('-----------') print(j)('x', 'one') ----------- a b c d0 1 5 x one('x', 'three') ----------- a b c d2 3 7 x three('y', 'two') ----------- a b c d1 2 6 y two 3 4 8 y two
聚合函數agg()
print(df.groupby(df["c"]).agg(['min','max']))a b d min max min max min maxc x 1 3 5 7 one threey 2 4 6 8 two two
將結果返回到數據框transform
print(df.groupby('c').transform('mean')) a b0 2 6 1 3 7 2 2 6 3 3 7
數據透視表
table =pd.pivot_table(df, values='a', index=['c'],columns=['d'], aggfunc=np.sum) d one three twoc x 1.0 3.0 NaN y NaN NaN 6.0
感謝各位的閱讀,以上就是“Pandas怎么實現分組”的內容了,經過本文的學習后,相信大家對Pandas怎么實現分組這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。