中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

hadoop-streaming是什么

發布時間:2021-12-08 10:09:47 來源:億速云 閱讀:153 作者:小新 欄目:云計算

這篇文章給大家分享的是有關hadoop-streaming是什么的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。

Hadoop Streaming是Hadoop提供的一個編程工具,它允許用戶使用任何可執行文件或者腳本文件作為Mapper和Reducer,例如:

采用shell腳本語言中的一些命令作為mapper和reducer(cat作為mapper,wc作為reducer)

bin/hadoop jar contrib/streaming/hadoop-0.20.2-streaming.jar -input
input -output output -mapper /bin/cat -reducer /usr/bin/wc

mapper和reducer會從標準輸入中讀取用戶數據,一行一行處理后發送給標準輸出。Streaming工具會創建MapReduce作業,發送給各個tasktracker,同時監控整個作業的執行過程。

如果一個文件(可執行或者腳本)作為mapper,mapper初始化時,每一個mapper任務會把該文件作為一個單獨進程啟動,mapper任務運行時,它把輸入切分成行并把每一行提供給可執行文件進程的標準輸入。 同時,mapper收集可執行文件進程標準輸出的內容,并把收到的每一行內容轉化成key/value對,作為mapper的輸出。 默認情況下,一行中第一個tab之前的部分作為key,之后的(不包括tab)作為value。如果沒有tab,整行作為key值,value值為null。

對于reducer,類似。

以上是Map/Reduce框架和streaming mapper/reducer之間的基本通信協議。

Hadoop Streaming用法

Usage: $HADOOP_HOME/bin/hadoop jar \

$HADOOP_HOME/contrib/streaming/hadoop-*-streaming.jar [options]

options:

(1)-input:輸入文件路徑

(2)-output:輸出文件路徑

(3)-mapper:用戶自己寫的mapper程序,可以是可執行文件或者腳本

(4)-reducer:用戶自己寫的reducer程序,可以是可執行文件或者腳本

(5)-file:打包文件到提交的作業中,可以是mapper或者reducer要用的輸入文件,如配置文件,字典等。

(6)-partitioner:用戶自定義的partitioner程序

(7)-combiner:用戶自定義的combiner程序(必須用java實現)

(8)-D:作業的一些屬性(以前用的是-jonconf),具體有:
            1)mapred.map.tasks:map task數目
            2)mapred.reduce.tasks:reduce task數目
            3)stream.map.input.field.separator/stream.map.output.field.separator: map task輸入/輸出數
據的分隔符,默認均為\t。
             4)stream.num.map.output.key.fields:指定map task輸出記錄中key所占的域數目
             5)stream.reduce.input.field.separator/stream.reduce.output.field.separator:reduce task輸入/輸出數據的分隔符,默認均為\t。
             6)stream.num.reduce.output.key.fields:指定reduce task輸出記錄中key所占的域數目
另外,Hadoop本身還自帶一些好用的Mapper和Reducer。

感謝各位的閱讀!關于“hadoop-streaming是什么”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

盈江县| 嘉荫县| 文昌市| 九寨沟县| 凉城县| 太康县| 屏边| 古浪县| 枣庄市| 佛坪县| 泉州市| 盈江县| 民和| 铁岭县| 台山市| 湄潭县| 佛坪县| 龙胜| 安康市| 吉木萨尔县| 台湾省| 庆阳市| 得荣县| 宣化县| 玉屏| 乌苏市| 台北市| 同德县| 古蔺县| 巴塘县| 靖安县| 库尔勒市| 通渭县| 瑞金市| 宝坻区| 佛山市| 肇州县| 南漳县| 宁夏| 洪江市| 银川市|