你可以使用pandas
庫來操作和處理csv文件,刪除重復數據的方法如下:
首先,導入pandas
庫:
import pandas as pd
然后,使用read_csv()
函數讀取csv文件并將其保存為一個DataFrame
對象:
df = pd.read_csv("data.csv")
接下來,使用drop_duplicates()
函數刪除重復的數據行:
df.drop_duplicates(inplace=True)
最后,將處理后的數據保存為新的csv文件:
df.to_csv("new_data.csv", index=False)
完整的代碼如下所示:
import pandas as pd
df = pd.read_csv("data.csv")
df.drop_duplicates(inplace=True)
df.to_csv("new_data.csv", index=False)
這樣就可以刪除csv文件中的重復數據了。