您好,登錄后才能下訂單哦!
hdfs是分布式的文件系統,用來在廉價的集群上做大數據量的存儲。
1.大文件被切割成小文件,使用分而治之的思想讓很多服務器對同一個文件進行聯合管理
2.每個小文件做冗余備份,并且分散存到不同的服務器,做到高可靠不丟失
namenode:集群老大,掌管文件系統目錄樹,處理客戶端讀且請求
SecondaryNamenode:持久化元數據,主要給 namenode 分擔壓力之用
DataNode:存儲整個集群所有數據塊,處理真正數據讀寫
- HDFS 中的文件在物理上是分塊存儲(block),塊的大小可以通過配置參數(dfs.blocksize)來規定,默認大小在 hadoop2.x 版本中是 128M,老版本中是 64M
- HDFS 文件系統會給客戶端提供一個統一的抽象目錄樹,客戶端通過路徑來訪問文件
- namenode 是 HDFS 集群主節點,負責維護整個 hdfs 文件系統的目錄樹,以及每一個路徑(文件)所對應的 block 塊信息(block 的 id,及所在的 datanode 服務器)
- datanode 是 HDFS 集群從節點,每一個 block 都可以在多個 datanode 上存儲多個副本(副本數量也可以通過參數設置 dfs.replication,默認是 3)
- HDFS 是設計成適應一次寫入,多次讀出的場景,且不支持文件的修改
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。