在Hive中,可以使用正則表達式函數regexp_extract_all
來提取數據中的所有數字。
例如,假設有一個名為data
的表,包含一個名為text
的列,里面存儲了一些文本數據,其中包含數字。可以使用以下方法來提取所有數字:
SELECT regexp_extract_all(text, '[0-9]+') AS numbers
FROM data;
上述語句將提取text
列中的所有數字,并將其數組返回。如果想要每個數字單獨的行返回,可以使用explode
函數:
SELECT explode(regexp_extract_all(text, '[0-9]+')) AS number
FROM data;
這樣將會返回每個數字作為一行的結果集。