Python中的set()函數用于創建一個無序且不重復的集合。在數據處理中,set函數可以用來去除列表中的重復元素,或者用來對數據進行交集、并集、差集等操作。
例如,可以利用set函數去除一個列表中的重復元素:
data = [1, 2, 3, 2, 4, 5, 1]
unique_data = set(data)
print(unique_data)
# 輸出結果為 {1, 2, 3, 4, 5}
另外,set函數還可以對兩個集合進行交集、并集、差集等操作:
set1 = {1, 2, 3, 4, 5}
set2 = {3, 4, 5, 6, 7}
intersection = set1.intersection(set2) # 交集
union = set1.union(set2) # 并集
difference = set1.difference(set2) # 差集
print(intersection, union, difference)
# 輸出結果為 {3, 4, 5} {1, 2, 3, 4, 5, 6, 7} {1, 2}
因此,set函數在數據處理中起著去重、集合運算等重要角色。