在R語言中,可以使用duplicated()
函數來篩選重復數據。該函數返回一個邏輯向量,表示每個元素是否為重復的數據。通過將這個邏輯向量作為索引,可以篩選出重復的數據。
以下是一個示例:
# 創建一個包含重復數據的向量
x <- c(1, 2, 3, 2, 4, 3, 5)
# 使用duplicated()函數找出重復的數據
duplicated_indices <- duplicated(x)
# 使用邏輯向量作為索引,篩選出重復的數據
duplicated_values <- x[duplicated_indices]
# 輸出結果
print(duplicated_values)
輸出結果為:
[1] 2 3
上述示例中,原始向量x
中包含重復數據,使用duplicated()
函數找出重復的數據后,得到邏輯向量duplicated_indices
,然后使用邏輯向量作為索引,篩選出重復的數據。最終輸出結果為重復的數值2和3。