在Pandas中,resample方法用于重新采樣時間序列數據。
使用resample方法的一般語法如下:
df.resample(rule, how, axis, fill_method, closed, label)
其中,常用參數的含義如下:
rule:重新采樣的規則。可以是字符串(如’5Min’表示每5分鐘重新采樣一次)或pandas.DateOffset對象。
how:重新采樣的方法。可以是函數名(如’mean’表示求均值)或字符串(如’sum’表示求和)。
axis:重新采樣的軸。0表示按行重新采樣,1表示按列重新采樣。默認為0。
fill_method:填充方法。對于重采樣頻率增大的情況,可以使用’ffill’或’bfill’進行前向或后向填充。默認為None。
closed:規定區間的開閉情況。'left’表示區間左閉右開(默認),'right’表示區間左開右閉。
label:重新采樣后的時間標簽位置。'left’表示取區間左邊界作為標簽(默認),'right’表示取區間右邊界作為標簽。
下面是一個使用resample方法重新采樣時間序列數據的示例:
import pandas as pd
# 創建一個時間序列數據
data = pd.Series([1, 2, 3, 4, 5], index=pd.date_range('2021-01-01', periods=5, freq='D'))
# 按周重新采樣,求和
resampled_data = data.resample('W').sum()
print(resampled_data)
輸出結果為:
2021-01-03 6
2021-01-10 9
Freq: W-SUN, dtype: int64
在上述示例中,我們創建了一個包含5個元素的時間序列數據data,并將其按周重新采樣,并求和得到resampled_data。