中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

淺談HDFS的寫流程

發布時間:2020-07-28 10:14:59 來源:網絡 閱讀:4604 作者:半邊書生123 欄目:大數據

1、使用HDFS提供的客戶端Client,向遠程的Namenode發起RPC請求

2、Namenode會檢查要創建的文件是否已經存在,創建者是否有權限進行操作,成功則會為文件創建一個記錄,否則會讓客戶端拋出異常;

3、當客戶端開始寫入文件的時候,客戶端會將文件切分成多個packets,并在內部以數據隊列“data queue(數據隊列)”的形式管理這些packets,并向Namenode申請blocks,獲取用來存儲replicas的合適的datanode列表,列表的大小根據Namenode中replication的設定而定;

4、開始以pipeline(管道)的形式將packet寫入所有的replicas中。開發庫把packet以流的方式寫入第一個datanode,該datanode把該packet存儲之后,再將其傳遞給在此pipeline中的下一個datanode,直到最后一個datanode,這種寫數據的方式呈流水線的形式。

5、最后一個datanode成功存儲之后會返回一個ack packet(確認隊列),在pipeline里傳遞至客戶端,在客戶端的開發庫內部維護著"ack queue",成功收到datanode返回的ack packet后會從"ack queue"移除相應的packet。

6、如果傳輸過程中,有某個datanode出現了故障,那么當前的pipeline會被關閉,出現故障的datanode會從當前的pipeline中移除,剩余的block會繼續剩下的datanode中繼續以pipeline的形式傳輸,同時Namenode會分配一個新的datanode,保持replicas設定的數量。

7、客戶端完成數據的寫入后,會對數據流調用close()方法,關閉數據流;

8、只要寫入了dfs.replication.min的復本數(默認為1),寫操作就會成功,并且這個塊可以在集群中異步復制,直到達到其目標復本數(dfs.replication的默認值為3),因為namenode已經知道文件由哪些塊組成,所以它在返回成功前只需要等待數據塊進行最小量的復制。

淺談HDFS的寫流程

客戶端將數據寫入HDFS的流程圖



淺談HDFS的寫流程


向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

乐昌市| 汶上县| 兴文县| 丰原市| 姚安县| 南汇区| 德格县| 衡水市| 龙游县| 云安县| 威信县| 平定县| 大庆市| 襄樊市| 隆安县| 宾川县| 甘洛县| 美姑县| 香格里拉县| 旬阳县| 吴旗县| 英德市| 资溪县| 邓州市| 调兵山市| 辽源市| 霍林郭勒市| 灵璧县| 方山县| 喀喇沁旗| 秦安县| 武隆县| 泉州市| 金昌市| 桑日县| 平顶山市| 家居| 临朐县| 凤翔县| 勃利县| 南平市|