中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

CDH如何使用HDFS分層存儲

發布時間:2021-07-30 16:26:47 來源:億速云 閱讀:233 作者:Leah 欄目:大數據

本篇文章為大家展示了CDH如何使用HDFS分層存儲,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。

配置并使用HDFS分層存儲

在CM上修改DataNode數據目錄,將六塊SSD盤設置為SSD,另外十六塊盤,六塊設置為ARCHIVE,十塊設置為DISK

CDH如何使用HDFS分層存儲

CDH如何使用HDFS分層存儲

1.測試使用SSD存儲,執行wordcount

未提交作業前磁盤空間的容量

CDH如何使用HDFS分層存儲

設置提交wordcount任務的HDFS數據目錄的策略為ALL_SSD

CDH如何使用HDFS分層存儲

執行生成數據的腳本,生成1TB測試數據

CDH如何使用HDFS分層存儲

生成數據后查看磁盤,只有SSD容量增長了

CDH如何使用HDFS分層存儲

提交wordcount任務

CDH如何使用HDFS分層存儲

wordcount任務完成后查看磁盤,由于wordcount在執行過程中產生的中間數據落磁盤的目錄未指定存儲策略,所以默認使用hot策略,因此造成DISK存儲的目錄數據量有增長

CDH如何使用HDFS分層存儲

2.測試使用ARCHIVE存儲,執行sort

未提交作業前磁盤空間的容量

CDH如何使用HDFS分層存儲

設置提交sort任務的HDFS數據目錄的策略為cold

CDH如何使用HDFS分層存儲

執行生成數據的腳本,生成1TB測試數據

CDH如何使用HDFS分層存儲

生成數據后查看磁盤,只有ARCHIVE類型的磁盤容量增長了

CDH如何使用HDFS分層存儲

提交sort任務

CDH如何使用HDFS分層存儲

sort任務完成后查看磁盤,由于sort在執行過程中產生的中間數據落磁盤的目錄未指定存儲策略,所以默認使用hot策略,因此造成除了ARCHIVE存儲的目錄增長了之外,DISK存儲的目錄數據量也有增長

CDH如何使用HDFS分層存儲

3.測試使用DISK存儲,執行terasort

未提交作業前磁盤空間的容量

CDH如何使用HDFS分層存儲

設置提交terasort任務的HDFS數據目錄的策略為hot

CDH如何使用HDFS分層存儲

執行生成數據的腳本,生成1TB測試數據

CDH如何使用HDFS分層存儲

生成數據后查看磁盤,只有DISK存儲的目錄數據增長了

CDH如何使用HDFS分層存儲

提交terasort任務

CDH如何使用HDFS分層存儲

terasort任務完成后查看磁盤,發現只有DISK存儲的目錄數據增長了

CDH如何使用HDFS分層存儲

總結

1.可以在CM上對HDFS的數據目錄進行配置,配置上每塊盤的存儲類型,然后在使用HDFS時,對相應的HDFS指定存儲策略,這樣就可以讓指定的數據存儲到對應存儲類型的磁盤,實現HDFS的分層存儲。

2.在使用HDFS分層存儲時需要注意對數據的分配,對于使用頻繁的數據,可以存放在SSD上,對于歸檔的數據可以存放到ARCHIVE類型的磁盤,對于一些常用的基本數據可以存放在DISK類型的磁盤,對數據進行合理的分配,可以讓所有磁盤的性能得到最好的發揮,同時可以獲得最高的性價比。

Fayson的github:

https://github.com/fayson/cdhproject

上述內容就是CDH如何使用HDFS分層存儲,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

新津县| 云梦县| 连江县| 逊克县| 江孜县| 库尔勒市| 长兴县| 衢州市| 厦门市| 衡山县| 富宁县| 珠海市| 崇仁县| 新沂市| 云龙县| 广宁县| 体育| 西和县| 华蓥市| 广德县| 华池县| 阿鲁科尔沁旗| 灯塔市| 衡阳县| 曲阳县| 蒙阴县| 图木舒克市| 浮梁县| 西昌市| 囊谦县| 博野县| 闵行区| 桦川县| 昌图县| 扎赉特旗| 来安县| 高青县| 南汇区| 凌海市| 塔城市| 嘉黎县|