在Python中,groupby函數是通過pandas庫的DataFrame對象使用的。該函數用于根據一個或多個列對數據進行分組。
下面是groupby函數的基本用法:
import pandas as pd
# 創建一個DataFrame對象
data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'John'],
'Age': [20, 25, 30, 20, 30],
'City': ['Seattle', 'New York', 'Seattle', 'Seattle', 'New York']}
df = pd.DataFrame(data)
# 使用groupby函數進行分組
grouped = df.groupby('City')
# 對分組后的數據執行聚合操作
result = grouped.mean()
print(result)
運行以上代碼,輸出結果如下:
Age
City
New York 27.5
Seattle 23.3
在上面的例子中,我們首先創建了一個DataFrame對象,其中包含了姓名、年齡和城市的數據。然后我們使用groupby函數根據城市進行分組。最后,我們對分組后的數據執行了均值操作,得到了每個城市對應的平均年齡。
除了使用單個列進行分組之外,我們還可以使用多個列進行分組。例如,可以在groupby函數中傳入一個由多個列名組成的列表。例如:
grouped = df.groupby(['City', 'Age'])
這樣就會根據城市和年齡進行分組。
除了mean函數,groupby函數還可以與其他聚合函數一起使用,如sum、count、min、max等。
希望以上內容能夠幫助到你!