在Hive中,collect_set函數用于將一個列中的所有不重復的值收集到一個數組中。它的基本語法如下:
SELECT collect_set(column_name) FROM table_name;
其中,column_name是要收集不重復值的列名,table_name是數據表的名稱。
例如,假設我們有一個名為employee的表,包含一個名為department的列,我們想要收集所有不重復的部門名稱,可以使用以下查詢:
SELECT collect_set(department) FROM employee;
這將返回一個包含所有不重復部門名稱的數組。