在SQL中,collect_set
函數用于收集給定列中不重復的值,并將這些值存儲為一個集合。通常用于對數據進行去重操作。
語法如下:
collect_set(column_name)
示例:
假設有一個表employee
,包含department_id
和employee_name
兩列數據,現在想要查找每個部門中的唯一員工姓名,可以使用collect_set
函數進行操作:
SELECT department_id, collect_set(employee_name) as unique_employees
FROM employee
GROUP BY department_id;
在上面的示例中,collect_set(employee_name)
將返回每個部門中唯一的員工姓名集合。