在Apache Pig中執行數據篩選操作可以使用FILTER關鍵字。以下是一個簡單的示例:
假設我們有一個包含學生信息的數據集,并且我們想要篩選出年齡大于18歲的學生:
student_data = LOAD 'student_data.txt' USING PigStorage(',') AS (name:chararray, age:int, grade:chararray);
filtered_data = FILTER student_data BY age > 18;
DUMP filtered_data;
在上面的示例中,我們首先加載了包含學生信息的數據集,并指定了字段的名稱和類型。然后使用FILTER關鍵字對數據進行篩選,只保留年齡大于18歲的學生信息。最后使用DUMP命令來查看篩選后的數據集。