中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Hadoop:適合大數據的分布式存儲與計算平臺(第三講)

發布時間:2020-07-18 20:55:21 來源:網絡 閱讀:1528 作者:51_天天向上 欄目:大數據

1.hadoop:

    作者:Doug Cutting

    受Google三篇論文的啟發

2.版本:

  Apache: 官方版本(1.1.2),學習使用

  Cloudera:在apache版本的基礎上添加功能,實現商業用途

  Yahoo:現在已經集中在apache的版本上

3.hadoop的核心項目

  HDFS:(Hadoop Distributed File System) 分布式文件系統

  MapReduce:并行計算框架

4.HDFS的架構(主從結構中,主節點負責管理。從節點負責操作

  主從結構(只有一個主節點namenode,可以有很多個從節點datanodes)

  namenode負責:

        接收用戶的操作請求

        維護文件系統的目錄結構

        管理文件與block之間的關系,block與datanode之間的關系

 datanode負責:

        存儲文件

        文件被分成block存儲在磁盤上

        為保證數據安全,文件會有多個副本

5.MapReduce的架構

  主從結構(只有一個主節點JobTracker,可以用很多個從節點TaskTrackers)

  JobTracker負責:

        接收客戶提交的計算任務

        把計算任務分給TaskTracker執行

        監控TaskTracker的執行情況

  TaskTrackers負責:

        執行JobTracker分配的計算任務

6.Hadoop的特點:

擴容能力(Scalable):能可靠地存儲和處理千兆字節(PB)數據;

成本低(Economical):可以通過普通機器組成的服務器群來分發以及處理數據;

高效率(Efficient):通過分發數據,hadoop可以在數據的所在節點上并行處理;

可性靠(Reliable):hadoop能自動地維護數據的多份副本,并且在任務失敗后能自動重新部署計算任務

7.Hadoop集群的物理分布

Hadoop:適合大數據的分布式存儲與計算平臺(第三講)

說明:

     a.下方的Rack分別表示兩個機柜,分別存放多個服務器,左右兩機柜都連接有自己的交換機,左右兩個交換機又和總的交換機連接,所以,機柜上的各個服務器之間可以互相訪問;

     b.機柜上兩個主節點分別都獨占一臺服務器,而從節點組合在一起存放在一臺服務器上

8.單節點物理結構

   Hadoop:適合大數據的分布式存儲與計算平臺(第三講)

  說明:左右圖分別表示主節點和從節點,圖中主從節點都使用linux系統的服務器,并且都運行在java虛擬機上,因為hadoop是基于java開發的

9.Hadoop部署方式

  本地部署(不常用)

  偽分布模式(學習使用)

  集群模式(公司使用)

10.安裝前準備軟件

    VitualVox

    centos

    jdk-6u24-linux-xxx.bin

    hadoop-1.1.2.tar.gz

11.偽分布模式安裝步驟:(6步)

   關閉防火墻

   修改ip

   修改hostname

   設置ssh自動登錄

   安裝jdk

   安裝hadoop


















向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

浦城县| 兴城市| 北票市| 怀化市| 新田县| 新余市| 多伦县| 牟定县| 望江县| 江城| 景德镇市| 海城市| 东明县| 萨迦县| 崇文区| 余姚市| 天门市| 汉川市| 永泰县| 四子王旗| 绍兴县| 饶河县| 淮安市| 灌云县| 邢台市| 广平县| 双桥区| 祁门县| 阿克陶县| 临沧市| 青阳县| 昔阳县| 夏邑县| 佳木斯市| 焉耆| 西安市| 嘉善县| 荔浦县| 满城县| 宜州市| 马尔康县|