您好,登錄后才能下訂單哦!
這篇文章主要介紹了HDFS中DataNode有什么作用,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
三個進程
1)NameNode (NN): 名稱節點 --》client第一個操作的對象
NameNode的功能: 文件系統的命名空間
1.文件名稱
2.文件目錄結構
3.文件的屬性(權限 創建時間 副本數)
4.文件對應哪些數據塊--》這些數據塊對應哪些DataNode節點上,不會持久化存儲這個映射關系,通過集群的啟動和運行時,datanode定期發送blockReport給NN,以此NN在【內存】中動態維護這種映射關系。
存儲: 維護文件系統樹及整個樹內的所有文件和目錄,這些信息以兩種文件形式永久保存在本地磁盤上,命名空間鏡像文件fsimage+編輯日志editlog
2)DataNode (DN): 數據節點 --》存儲數據的
DataNode的作用:
1.每隔3秒發送一次心跳 參數可配置 (默認)
2.每隔10次心跳發送一次blockReport (30s)(默認)
存儲: 數據塊+數據塊校驗,和與NN通信
3)Secondary NameNode(SNN): 第二名稱節點
Secondary NameNode的作用:
定期合并fsimage+editlog文件為新的fsimage,推送給NN,稱為檢查點,checkpoint
存儲: 命名空間鏡像文件fsimage+編輯日志editlog
參數:fs.checkpoint.period-->1h fs.checkpoint.size -->64M
2.block(數據塊)
大小: 64M 128M(目前2.x中默認)
參數: dfs.blocksize
3.副本數
dfs.replication : 3 一個塊會變為3個塊
案例
1個文件130M : 128M 2M 兩個塊 默認塊大小為128M 實際存儲: 130M*3 多少個塊: 6
4.副本放置策略
第一副本: 放置在上傳文件的DataNode上;
如果是集群外提交,則隨機挑選一臺磁盤
不太慢、 CPU不太忙的節點上;
第二副本: 放置在于第一個副本不同的機
架的節點上;
第三副本: 與第二個副本相同機架的不同
節點上;
如果還有更多的副本:隨機放在節點中;
感謝你能夠認真閱讀完這篇文章,希望小編分享的“HDFS中DataNode有什么作用”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。