您好,登錄后才能下訂單哦!
這篇文章主要介紹hadoop中的三大組件分別是什么,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!
hadoop三大組件:1、HDFS,一個高可靠、高吞吐量的分布式文件系統;2、MapReduce,一個分布式的離線并行計算框架;3、Yarn,分布式資源管理框架。
hadoop三大組件:
1、HDFS
一個高可靠、高吞吐量的分布式文件系統
存儲海量數據
分布式
安全性
副本數據
數據是以block的方式進行存儲的,128M
比如:200M—128M 72M
2、MapReduce
一個分布式的離線并行計算框架
對海量數據的處理
分布式
思想:
分而治之
大數據集分為小的數據集
每個數據集進行邏輯業務處理(map)
合并統計數據結果(reduce)
3、Yarn
分布式資源管理框架
管理整個集群的資源(內存、CPU核數)
分配調度集群的資源
以上是“hadoop中的三大組件分別是什么”這篇文章的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。