hadoop2.0集群的搭建方法

發布時間：2021-07-27 19:05:37 來源：億速云閱讀：185 作者：chen 欄目：云計算

這篇文章主要講解了“hadoop2.0集群的搭建方法”，文中的講解內容簡單清晰，易于學習與理解，下面請大家跟著小編的思路慢慢深入，一起來研究和學習“hadoop2.0集群的搭建方法”吧！

hadoop2.2.0集群搭建

PS：apache提供的hadoop-2.2.0的安裝包是在32位操作系統編譯的，

因為hadoop依賴一些C++的本地庫，所以如果在64位的操作上安裝

hadoop-2.2.0就需要重新在64操作系統上重新編譯

1.準備工作:(參考偽分布式搭建)

1.1修改Linux主機名

1.2修改IP

1.3修改主機名和IP的映射關系

1.4關閉防火墻

1.5ssh免登陸

1.6.安裝JDK，配置環境變量等

2.集群規劃：

hadoop2.0集群的搭建方法

PS：

在hadoop2.0中通常由兩個NameNode組成，一個處于active狀態，

另一個處于standby狀態。Active NameNode對外提供服務，

而Standby NameNode則不對外提供服務，僅同步active namenode

的狀態，以便能夠在它失敗時快速進行切換。

hadoop2.0官方提供了兩種HDFS HA的解決方案，一種是NFS，

另一種是QJM。這里我們使用簡單的QJM。在該方案中，

主備NameNode之間通過一組JournalNode同步元數據信息，

一條數據只要成功寫入多數JournalNode即認為寫入成功。

通常配置奇數個JournalNode

這里還配置了一個zookeeper集群，用于ZKFC

（DFSZKFailoverController）故障轉移，當Active NameNode掛

掉了，會自動切換Standby NameNode為standby狀態

3.安裝步驟：

3.1.安裝配置zooekeeper集群

3.1.1解壓

tar -zxvf zookeeper-3.4.5.tar.gz -C /cloud/

3.1.2修改配置

cd /cloud/zookeeper-3.4.5/conf/

cp zoo_sample.cfg zoo.cfg

vim zoo.cfg

修改：dataDir=/cloud/zookeeper-3.4.5/tmp

在最后添加：

server.1=hadoop01:2888:3888

server.2=hadoop02:2888:3888

server.3=hadoop03:2888:3888

保存退出

然后創建一個tmp文件夾

mkdir /cloud/zookeeper-3.4.5/tmp

再創建一個空文件

touch /cloud/zookeeper-3.4.5/tmp/myid

最后向該文件寫入ID

echo 1 > /cloud/zookeeper-3.4.5/tmp/myid

3.1.3將配置好的zookeeper拷貝到其他節點(首先分別在hadoop02、

hadoop03根目錄下創建一個cloud目錄：mkdir /cloud)

scp -r /cloud/zookeeper-3.4.5/ hadoop02:/cloud/

scp -r /cloud/zookeeper-3.4.5/ hadoop03:/cloud/

注意：修改hadoop02、hadoop03對應

/cloud/zookeeper-3.4.5/tmp/myid內容

hadoop02：

echo 2 > /cloud/zookeeper-3.4.5/tmp/myid

hadoop03：

echo 3 > /cloud/zookeeper-3.4.5/tmp/myid

3.2.安裝配置hadoop集群

3.2.1解壓

tar -zxvf hadoop-2.2.0.tar.gz -C /cloud/

3.2.2配置HDFS（hadoop2.0所有的配置文件都在

$HADOOP_HOME/etc/hadoop目錄下）

將hadoop添加到環境變量中

vim /etc/profile

export JAVA_HOME=/usr/java/jdk1.6.0_45

export HADOOP_HOME=/cloud/hadoop-2.2.0

export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin

cd /cloud/hadoop-2.2.0/etc/hadoop

3.2.2.1修改hadoo-env.sh

export JAVA_HOME=/usr/java/jdk1.6.0_45

3,2.2.2修改core-site.xml

<name>fs.defaultFS</name>

</property>

<name>hadoop.tmp.dir</name>

<value>/cloud/hadoop-2.2.0/tmp</value>

</property>

<name>ha.zookeeper.quorum</name>

<value>

hadoop01:2181,hadoop02:2181,hadoop03:2181

</value>

</property>

</configuration>

3,2.2.3修改hdfs-site.xml

<!--指定hdfs的nameservice為ns1，

需要和core-site.xml中的保持一致 -->

<name>dfs.nameservices</name>

</property>

<name>dfs.ha.namenodes.ns1</name>

</property>

<name>

dfs.namenode.rpc-address.ns1.nn1

</name>

<value>hadoop01:9000</value>

</property>

<name>

dfs.namenode.http-address.ns1.nn1

</name>

<value>hadoop01:50070</value>

</property>

<name>

dfs.namenode.rpc-address.ns1.nn2

</name>

<value>hadoop02:9000</value>

</property>

<name>

dfs.namenode.http-address.ns1.nn2

</name>

<value>hadoop02:50070</value>

</property>

<!-- 指定NameNode的元數據在

JournalNode上的存放位置 -->

<name>

dfs.namenode.shared.edits.dir

</name>

<value>

qjournal://hadoop01:8485;hadoop02:8485;hadoop03:8485/ns1

</value>

</property>

<name>dfs.journalnode.edits.dir</name>

<value>/cloud/hadoop-2.2.0/journal</value>

</property>

<name>

dfs.ha.automatic-failover.enabled

</name>

</property>

<name>

dfs.client.failover.proxy.provider.ns1

</name>

<value>

org.apache.hadoop.hdfs.server.namenode.ha.

ConfiguredFailoverProxyProvider

</value>

</property>

<name>dfs.ha.fencing.methods</name>

<value>sshfence</value>

</property>

<name>

dfs.ha.fencing.ssh.private-key-files

</name>

</property>

</configuration>

3.2.2.4修改slaves

hadoop01

hadoop02

hadoop03

3.2.3配置YARN

3.2.3.1修改yarn-site.xml

<name>

yarn.resourcemanager.hostname

</name>

<value>hadoop01</value>

</property>

<!-- 指定nodemanager啟動時加載

server的方式為shuffle server -->

<name>

yarn.nodemanager.aux-services

</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

3.2.3.2修改mapred-site.xml

<name>

mapreduce.framework.name

</name>

</property>

</configuration>

3.2.4將配置好的hadoop拷貝到其他節點

scp -r /cloud/hadoop-2.2.0/ hadoo02:/cloud/

scp -r /cloud/hadoop-2.2.0/ hadoo03:/cloud/

3.2.5啟動zookeeper集群

（分別在hadoop01、hadoop02、hadoop03上啟動zk）

cd /cloud/zookeeper-3.4.5/bin/

./zkServer.sh start

查看狀態：

./zkServer.sh status

（一個leader，兩個follower）

3.2.6啟動journalnode（在hadoop01上啟動所有journalnode）

cd /cloud/hadoop-2.2.0

sbin/hadoop-daemons.sh start journalnode

(運行jps命令檢驗，多了JournalNode進程)

3.2.7格式化HDFS

在hadoop01上執行命令:

hadoop namenode -format

格式化后會在根據core-site.xml中的hadoop.tmp.dir

配置生成個文件，這里我配置的是/cloud/hadoop-2.2.0/tmp，

然后將/cloud/hadoop-2.2.0/tmp拷貝到hadoop02的

/cloud/hadoop-2.2.0/下。

scp -r tmp/ hadoop02:/cloud/hadoop-2.2.0/

3.2.8格式化ZK(在hadoop01上執行即可)

hdfs zkfc -formatZK

3.2.9啟動HDFS(在hadoop01上執行)

sbin/start-dfs.sh

3.3.10啟動YARN(在hadoop01上執行)

sbin/start-yarn.sh

到此，hadoop2.2.0配置完畢，可以統計瀏覽器訪問:

http://192.168.1.201:50070

NameNode 'hadoop01:9000' (active)

http://192.168.1.202:50070

NameNode 'hadoop02:9000' (standby)

驗證HDFS HA

首先向hdfs上傳一個文件

hadoop fs -put /etc/profile /profile

hadoop fs -ls /

然后再kill掉active的NameNode

kill -9 <pid of NN>

通過瀏覽器訪問：http://192.168.1.202:50070

NameNode 'hadoop02:9000' (active)

這個時候hadoop02上的NameNode變成了active

在執行命令：

hadoop fs -ls /

-rw-r--r-- 3 root supergroup 1926 2014-02-06 15:36 /profile

剛才上傳的文件依然存在！！！

手動啟動那個掛掉的NameNode

sbin/hadoop-daemon.sh start namenode

通過瀏覽器訪問：http://192.168.1.201:50070

NameNode 'hadoop01:9000' (standby)

驗證YARN：

運行一下hadoop提供的demo中的WordCount程序：

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce

-examples-2.2.0.jar wordcount /profile /out

OK，大功告成！！！

感謝各位的閱讀，以上就是“hadoop2.0集群的搭建方法”的內容了，經過本文的學習后，相信大家對hadoop2.0集群的搭建方法這一問題有了更深刻的體會，具體使用情況還需要大家實踐驗證。這里是億速云，小編將為大家推送更多相關知識點的文章，歡迎關注！

向AI問一下細節

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

hadoop2.0集群的搭建方法

猜你喜歡

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

hadoop2.0集群的搭建方法

猜你喜歡

最新資訊

相關推薦

相關標簽