hadoop-mapreduce的示例分析

發布時間：2021-12-08 10:21:03 來源：億速云閱讀：155 作者：小新欄目：云計算

這篇文章主要為大家展示了“hadoop-mapreduce的示例分析”，內容簡而易懂，條理清晰，希望能夠幫助大家解決疑惑，下面讓小編帶領大家一起研究并學習一下“hadoop-mapreduce的示例分析”這篇文章吧。

把整個Hadoop看作是容器，那么Mapper和Reduce就是容器里的組件，*Context保存了組件的一些配置信息，同時也是和容器通信的機制。

參數	作用	缺省值	其它實現
InputFormat	將輸入的數據集切割成小數據集 InputSplits, 每一個InputSplit 將由一個 Mapper負責處理。此外InputFormat 中還提供一個RecordReader 的實現, 將一個 InputSplit 解析成<key,value> 對提供給 map函數。	TextInputFormat (針對文本文件，按行將文本文件切割成 InputSplits, 并用LineRecordReader 將 InputSplit 解析成 <key,value> 對，key 是行在文件中的位置，value 是文件中的一行)	SequenceFileInputFormat
OutputFormat	提供一個 RecordWriter 的實現，負責輸出最終結果	TextOutputFormat (用 LineRecordWriter 將最終結果寫成純文件文件,每個 <key,value> 對一行，key 和 value 之間用 tab 分隔)	SequenceFileOutputFormat
OutputKeyClass	輸出的最終結果中 key 的類型	LongWritable
OutputValueClass	輸出的最終結果中 value 的類型	Text
MapperClass	Mapper 類，實現 map 函數，完成輸入的<key,value> 到中間結果的映射	IdentityMapper (將輸入的 <key,value> 原封不動的輸出為中間結果)	LongSumReducer, LogRegexMapper, InverseMapper
CombinerClass	實現 combine 函數，將中間結果中的重復 key 做合并	null (不對中間結果中的重復 key 做合并)
ReducerClass	Reducer 類，實現 reduce函數，對中間結果做合并，形成最終結果	IdentityReducer (將中間結果直接輸出為最終結果)	AccumulatingReducer, LongSumReducer
InputPath	設定 job 的輸入目錄, job 運行時會處理輸入目錄下的所有文件	null
OutputPath	設定 job 的輸出目錄，job的最終結果會寫入輸出目錄下	null
MapOutputKeyClass	設定 map 函數輸出的中間結果中 key 的類型	如果用戶沒有設定的話，使用OutputKeyClass
MapOutputValueClass	設定 map 函數輸出的中間結果中 value 的類型	如果用戶沒有設定的話，使用OutputValuesClass
OutputKeyComparator	對結果中的 key 進行排序時的使用的比較器	WritableComparable
PartitionerClass	對中間結果的 key 排序后，用此 Partition 函數將其劃分為R份,每份由一個Reducer 負責處理。	HashPartitioner (使用 Hash 函數做 partition)	KeyFieldBasedPartitioner PipesPartitioner

Job繼承自JobContext，提供了一系列的set方法，用于設置Job的一些屬性（Job更新屬性，JobContext讀屬性），同時，Job還提供了一些對Job進行控制的方法，如下：

l mapProgress：map的進度（0—1.0）；

l reduceProgress：reduce的進度（0—1.0）；

l isComplete：作業是否已經完成；

l isSuccessful：作業是否成功；

l killJob：結束一個在運行中的作業；

l getTaskCompletionEvents：得到任務完成的應答（成功/失敗）；

l killTask：結束某一個任務；

以上是“hadoop-mapreduce的示例分析”這篇文章的所有內容，感謝各位的閱讀！相信大家都有了一定的了解，希望分享的內容對大家有所幫助，如果還想學習更多知識，歡迎關注億速云行業資訊頻道！

向AI問一下細節

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

hadoop-mapreduce的示例分析

猜你喜歡

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

hadoop-mapreduce的示例分析

猜你喜歡

最新資訊

相關推薦

相關標簽