關于pandas.DataFrame.drop_duplicates的用法簡介

發布時間：2020-07-07 10:52:47 來源：億速云閱讀：1149 作者：清晨欄目：開發技術

這篇文章主要介紹關于pandas.DataFrame.drop_duplicates的用法簡介，文中介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們一定要看完！

如下所示：

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

subset考慮重復發生在哪一列，默認考慮所有列，就是在任何一列上出現重復都算作是重復數據

keep 包含三個參數first, last, False，first是指，保留搜索到的第一個重復數據，之后的都刪除；last是指，保留搜索到的最后一個重復數據，之前的搜索到的重復數據都刪除，False是指，把所有搜索到的重復數據都刪除，一個都不保留，即如果有兩行數據重復，把兩行數據都刪除，而不是保留其中一行。默認參數是first。

補充知識：python3刪除數據重復值，只保留第一項。drop_duplicates（）函數使用介紹

原始數據如下：

關于pandas.DataFrame.drop_duplicates的用法簡介

f 列的前3個數據都有重復項，現在要將重復值刪去，只保留第一項或最后一項。

使用drop_duplicates（）

drop_duplicates(self, subset=None, keep='first', inplace=False)

subset :如['a']代表a列中的重復值全部被刪除

keep:保留第一個值，參數為first,last

inplace:是否替換原來的df,默認為False

import pandas as pd
data = pd.read_table("C:/Users/xujinhua/Desktop/aa/a.txt",header=None, names=['a','b','c','d','e','f','g']) 
#讀取文件數據，并將列命名為abcdef
data.drop_duplicates(subset='f', keep='first', inplace=True)
print(data)

結果：

關于pandas.DataFrame.drop_duplicates的用法簡介

可以看到 f 列中的重復值都被刪除,且保留了第一項

以上是關于pandas.DataFrame.drop_duplicates的用法簡介的所有內容，感謝各位的閱讀！希望分享的內容對大家有幫助，更多相關知識，歡迎關注億速云行業資訊頻道！

向AI問一下細節

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

關于pandas.DataFrame.drop_duplicates的用法簡介

猜你喜歡

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

關于pandas.DataFrame.drop_duplicates的用法簡介

猜你喜歡

最新資訊

相關推薦

相關標簽