您好,登錄后才能下訂單哦!
這篇文章將為大家詳細講解有關使用Pandas怎么實現一個分組計數功能,文章內容質量較高,因此小編分享給大家做個參考,希望大家閱讀完這篇文章后對相關知識有一定的了解。
在對dataframe進行分析的時候會遇到需要分組計數,計數的column中屬性有重復,但又需要僅對不重復的項計數(即重復N次出現的項只計1次)。
函數如下:
dataframe.groupby([‘分組的列名']).需要計數的列名.nunique()
數組“data”如下:
StoreID | Sales | SalesDate | Channel |
---|---|---|---|
A | 100 | 2018/1/1 | 01 |
A | 90 | 2018/1/1 | 02 |
A | 110 | 2018/1/2 | 01 |
B | 82.2 | 2018/1/1 | 01 |
B | 90 | 2018/1/2 | 02 |
如果要按StoreID來統計每一家店的營業日期數(可以通過不計重復的count “SalesDate”來完成)
代碼如下:
data.groupby(['StoreID']).SalesDate.nunique()
補充:pandas 統計分組內不重復計數
在數據分析中的數據處理過程中,經常需要對數據進行分組計數,看下下面這組數據
數據中name 為C 的有三行,其中有2個code是重復的
按name 分組,統計每組中code的不重復數量
df.groupby('name')['code'].nunique() # 以name 分組后,統計code的不重復數目
結果如下:
df.groupby('name')['code'].nunique().sort_values(ascending=False) # 以name 分組后,統計code的不重復數目
關于使用Pandas怎么實現一個分組計數功能就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。