中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Spark集群搭建的方法

發布時間:2022-02-18 16:14:11 來源:億速云 閱讀:192 作者:iii 欄目:開發技術

這篇文章主要介紹“Spark集群搭建的方法”,在日常操作中,相信很多人在Spark集群搭建的方法問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”Spark集群搭建的方法”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!

spark是一個用于大規模數據處理的統一計算引擎。適用于各種各樣原先需要多種不同的分布式平臺處理的場景,包括批處理、迭代計算、交互式查詢、流處理。通過統一的框架將各種處理流程整合到一起。

Spark集群搭建的方法

1 解壓縮文件

將spark-3.0.0-bin-hadoop3.2.tgz.tgz文件上傳到Linux并解壓縮在指定位置

tar -zxvf spark-3.0.0-bin-hadoop3.2.tgz -C /opt/modulecd /opt/module  
mv spark-3.0.0-bin-hadoop3.2 spark-standalone

2 修改配置文件

\1) 進入解壓縮后路徑的conf目錄,修改slaves.template文件名為slaves

mv slaves.template slaves

\2) 修改slaves文件,添加work節點

hadoop102hadoop103hadoop104

\3) 修改spark-env.sh.template文件名為spark-env.sh

mv spark-env.sh.template spark-env.sh

\4) 修改spark-env.sh文件,添加JAVA_HOME環境變量和集群對應的master節點

export JAVA_HOME=/opt/module/jdk1.8.0_212
SPARK_MASTER_HOST=hadoop102SPARK_MASTER_PORT=7077

注意:7077端口,相當于hadoop3.x內部通信的8020端口,此處的端口需要確認自己的虛擬機配置

\5) 分發spark-standalone目錄

xsync spark-standalone

3 啟動集群

\1) 執行腳本命令:

sbin/start-all.sh

\2) 查看三臺服務器運行進程

================hadoop102================
3330 Jps
3238 Worker
3163 Master
================hadoop103================
2966 Jps
2908 Worker
================hadoop104================
2978 Worker
3036 Jps

\3) 查看Master資源監控Web UI界面: http://hadoop102:8080

4 提交應用

bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master spark://hadoop102:7077 \
./examples/jars/spark-examples_2.12-3.0.0.jar \
10

–class表示要執行程序的主類

–master spark://hadoop102:7077 獨立部署模式,連接到Spark集群

spark-examples_2.12-3.0.0.jar 運行類所在的jar包

數字10表示程序的入口參數,用于設定當前應用的任務數量

執行任務時,會產生多個Java進程

  Spark集群搭建的方法 

大數據Spark運行環境:Standalone模式與配置詳解 執行任務時,默認采用服務器集群節點的總核數,每個節點內存1024M。

5 配置歷史服務

由于spark-shell停止掉后,集群監控hadoop102:4040頁面就看不到歷史任務的運行情況,所以開發時都配置歷史服務器記錄任務運行情況。

\1) 修改spark-defaults.conf.template文件名為spark-defaults.conf

mv spark-defaults.conf.template spark-defaults.conf

\2) 修改spark-default.conf文件,配置日志存儲路徑

spark.eventLog.enabled          truespark.eventLog.dir               hdfs://hadoop102:8020/directory

注意:需要啟動hadoop集群,HDFS上的directory目錄需要提前存在。

sbin/start-dfs.sh
hadoop fs -mkdir /directory

\3) 修改spark-env.sh文件, 添加日志配置

export SPARK_HISTORY_OPTS="
-Dspark.history.ui.port=18080
-Dspark.history.fs.logDirectory=hdfs://hadoop102:8020/directory
-Dspark.history.retainedApplications=30"

注:寫成一行!!空格隔開!!!

參數1含義:WEB UI訪問的端口號為18080

參數2含義:指定歷史服務器日志存儲路徑

參數3含義:指定保存Application歷史記錄的個數,如果超過這個值,舊的應用程序信息將被刪除,這個是內存中的應用數,而不是頁面上顯示的應用數。

\4) 分發配置文件

xsync conf

\5) 重新啟動集群和歷史服務

sbin/start-all.shsbin/start-history-server.sh

\6) 重新執行任務

bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master spark://hadoop102:7077 \
./examples/jars/spark-examples_2.12-3.0.0.jar \
10

\7) 查看歷史服務:http://hadoop102:18080

6 配置高可用(HA)

所謂的高可用是因為當前集群中的Master節點只有一個,所以會存在單點故障問題。所以為了解決單點故障問題,需要在集群中配置多個Master節點,一旦處于活動狀態的Master發生故障時,由備用Master提供服務,保證作業可以繼續執行。這里的高可用一般采用Zookeeper設置

集群規劃:

  Spark集群搭建的方法 

\1) 停止集群

sbin/stop-all.sh

\2) 啟動Zookeeper

\3) 修改spark-env.sh文件添加如下配置

注釋如下內容:#SPARK_MASTER_HOST=hadoop102#SPARK_MASTER_PORT=7077添加如下內容:#Master監控頁面默認訪問端口為8080,但是會和Zookeeper沖突,所以改成8989,也可以自定義,訪問UI監控頁面時請注意SPARK_MASTER_WEBUI_PORT=8989export SPARK_DAEMON_JAVA_OPTS="
-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=hadoop102,hadoop103,hadoop104 -Dspark.deploy.zookeeper.dir=/spark"注:寫成一行!!空格隔開!!!

\4) 分發配置文件

xsync conf/

\5) 啟動集群

sbin/start-all.sh

\6) 啟動hadoop103的單獨Master節點,此時hadoop103節點Master狀態處于備用狀態

[bigdata@hadoop103 spark-standalone]$ sbin/start-master.sh

\7) 提交應用到高可用集群

bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master spark://hadoop102:7077,hadoop103:7077 \
./examples/jars/spark-examples_2.12-3.0.0.jar \
10

\8) 停止hadoop102的Master資源監控進程

\9) 查看hadoop103的Master 資源監控Web UI,稍等一段時間后,hadoop103節點的Master狀態提升為活動狀態

到此,關于“Spark集群搭建的方法”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

同心县| 富阳市| 九龙城区| 浮山县| 依兰县| 福鼎市| 台前县| 布拖县| 祁阳县| 涿州市| 钟山县| 嘉定区| 瑞昌市| 万山特区| 什邡市| 游戏| 大庆市| 广元市| 盐源县| 历史| 固始县| 山阳县| 汽车| 北安市| 巍山| 时尚| 滨州市| 龙海市| 扬州市| 阳原县| 隆德县| 清原| 陇西县| 武宣县| 惠来县| 夏津县| 禄劝| 北碚区| 遵义县| 兴宁市| 东海县|