中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

duplicated()函數在Pandas庫中的具體用法是什么

小樊
89
2024-09-12 18:31:51
欄目: 編程語言

duplicated() 函數在 Pandas 庫中用于檢查 DataFrame 或 Series 中的重復項

以下是 duplicated() 函數的基本用法:

  1. 對于一個 Pandas Series:
import pandas as pd

data = pd.Series(['A', 'B', 'A', 'C', 'B'])
duplicates = data.duplicated()

print(duplicates)

輸出結果將會是:

0    False
1    False
2     True
3    False
4     True
dtype: bool
  1. 對于一個 Pandas DataFrame:
import pandas as pd

data = {'Column1': ['A', 'B', 'A', 'C', 'B'],
        'Column2': [1, 2, 1, 3, 2]}

df = pd.DataFrame(data)
duplicates = df.duplicated()

print(duplicates)

輸出結果將會是:

0    False
1    False
2     True
3    False
4     True
dtype: bool

你還可以使用 duplicated() 函數的參數來自定義重復項檢測的行為。例如,你可以設置 keep 參數來指定保留哪個重復項。默認情況下,keep 參數設置為 'first',表示保留第一個出現的重復項,并將其他重復項標記為 True。你還可以將 keep 設置為 'last',這樣最后一個出現的重復項將被保留。此外,你還可以將 keep 設置為 False,這樣所有重復項都將被標記為 True

例如:

import pandas as pd

data = {'Column1': ['A', 'B', 'A', 'C', 'B'],
        'Column2': [1, 2, 1, 3, 2]}

df = pd.DataFrame(data)
duplicates = df.duplicated(keep='last')

print(duplicates)

輸出結果將會是:

0     True
1     True
2    False
3    False
4    False
dtype: bool

0
桃园市| 沿河| 定襄县| 天门市| 永福县| 滨海县| 乌兰浩特市| 九寨沟县| 蛟河市| 农安县| 育儿| 镇远县| 万荣县| 淄博市| 安多县| 乌拉特后旗| 宾川县| 颍上县| 昌乐县| 永仁县| 防城港市| 临洮县| 潞西市| 息烽县| 奉节县| 河南省| 辽阳市| 玛纳斯县| 紫阳县| 开封市| 伊吾县| 南阳市| 怀仁县| 波密县| 德兴市| 安新县| 彭州市| 开平市| 云和县| 天峻县| 虞城县|