中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Hive怎么實現WordCount

發布時間:2021-11-15 23:49:06 來源:億速云 閱讀:202 作者:柒染 欄目:云計算

這篇文章將為大家詳細講解有關Hive怎么實現WordCount,文章內容質量較高,因此小編分享給大家做個參考,希望大家閱讀完這篇文章后對相關知識有一定的了解。

1. 創建一個存放源數據的表(外部表)t_words_src, 表中字段line為string類型, 存放一行單詞

源數據示列: 

hello,tom
hello,jerry
hello,kitty
hello,world
hello,tom
hive> create external table t_words_src (line string)
row format delimited
fields terminated by '\n'    # 按\n來切分字段, 一行就是一個字段
location '/wc/input';    # 源數據路徑為 'hdfs://node1:9000/wc/input' 

hive> select * from t_words;
OK
hello,tom
hello,jerry
hello,kitty
hello,world
hello,tom

2. 創建一個存放所有單詞的表t_words, 表中字段word為string類型, 存放單詞

hive> create table t_words (word string);
hive> insert into table t_words select explode(split(line,',')) as word from t_words_src;

hive> select * from t_words;
OK
hello
tom
hello
jerry
hello
kitty
hello
world
hello
tom

3. 創建一個存放WordCount結果的表t_wc_result, 表中字段word為string類型, 存放單詞, counts為int類型, 存放單詞出現次數

hive> create table t_wc_result (word string, counts int);
hive> insert into table t_wc_result select word as word, count(word) as counts from t_words;

hive> select * from t_wc_result;
OK
hello	5
jerry	1
kitty	1
tom	2
world	1

相對MapReduce來說, Hive的HQL版WordCount寫起來代碼量少很多, 但他們的思想都是一樣的

關于Hive怎么實現WordCount就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

威远县| 泗阳县| 克什克腾旗| 河西区| 镇江市| 公主岭市| 武隆县| 海晏县| 那坡县| 闵行区| 三穗县| 铁岭县| 德江县| 西青区| 海口市| 龙胜| 土默特左旗| 汉源县| 巴林左旗| 吐鲁番市| SHOW| 邵武市| 定南县| 东乡族自治县| 青阳县| 金阳县| 大理市| 罗甸县| 习水县| 岳池县| 株洲县| 东乡县| 克山县| 双江| 安丘市| 钟山县| 德清县| 渭源县| 济源市| 伊宁市| 新余市|