中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

spark運行模式得示例分析

發布時間:2021-12-10 11:51:20 來源:億速云 閱讀:188 作者:小新 欄目:云計算

小編給大家分享一下spark運行模式得示例分析,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

Local模式

運行Spark最簡單的方法是通過Local模式(即偽分布式模式)。

    運行命令為:./bin/run-example org.apache.spark.examples.SparkPi local

基于standalone的Spark架構與作業執行流程

Standalone模式下,集群啟動時包括Master與Worker,其中Master負責接收客戶端提交的作業,管理Worker。提供了Web展示集群與作業信息。

提交作業有兩種方式,分別是Driver(作業的master,負責作業的解析、生成stage并調度task到,包含DAGScheduler)運行在Worker上,Driver運行在客戶端。接下來分別介紹兩種方式的作業運行原理。

Driver運行在Worker上

    通過org.apache.spark.deploy.Client類執行作業,作業運行命令如下:

        ./bin/spark-class org.apache.spark.deploy.Client launch spark://host:port file:///jar_url org.apache.spark.examples.SparkPi spark://host:port

    作業執行流如圖1所示。

spark運行模式得示例分析

                                                       圖1

作業執行流程描述:

  1. 客戶端提交作業給Master

  2. Master讓一個Worker啟動Driver,即SchedulerBackend。Worker創建一個DriverRunner線程,DriverRunner啟動SchedulerBackend進程。

  3. 另外Master還會讓其余Worker啟動Exeuctor,即ExecutorBackend。Worker創建一個ExecutorRunner線程,ExecutorRunner會啟動ExecutorBackend進程。

  4. ExecutorBackend啟動后會向Driver的SchedulerBackend注冊。SchedulerBackend進程中包含DAGScheduler,它會根據用戶程序,生成執行計劃,并調度執行。對于每個stage的task,都會被存放到TaskScheduler中,ExecutorBackend向SchedulerBackend匯報的時候把TaskScheduler中的task調度到ExecutorBackend執行。

  5. 所有stage都完成后作業結束。

Driver運行在客戶端

    直接執行Spark作業,作業運行命令如下(示例):

        ./bin/run-example org.apache.spark.examples.SparkPi spark://host:port

    作業執行流如圖2所示。

spark運行模式得示例分析

                                                        圖2

作業執行流程描述:

  1. 客戶端啟動后直接運行用戶程序,啟動Driver相關的工作:DAGScheduler和BlockManagerMaster等。

  2. 客戶端的Driver向Master注冊。

  3. Master還會讓Worker啟動Exeuctor。Worker創建一個ExecutorRunner線程,ExecutorRunner會啟動ExecutorBackend進程。

  4. ExecutorBackend啟動后會向Driver的SchedulerBackend注冊。Driver的DAGScheduler解析作業并生成相應的Stage,每個Stage包含的Task通過TaskScheduler分配給Executor執行。

  5. 所有stage都完成后作業結束。

基于Yarn的Spark架構與作業執行流程

spark運行模式得示例分析

這里Spark AppMaster相當于Standalone模式下的SchedulerBackend,Executor相當于standalone的ExecutorBackend,spark AppMaster中包括DAGScheduler和YarnClusterScheduler。

以上是“spark運行模式得示例分析”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

兴国县| 涞水县| 肥乡县| 翁源县| 麻栗坡县| 林芝县| 沐川县| 孝昌县| 通辽市| 怀仁县| 小金县| 溧阳市| 金堂县| 玛沁县| 宿松县| 广汉市| 布尔津县| 米林县| 青河县| 桦甸市| 恩施市| 东安县| 兴安县| 平原县| 彭泽县| 马鞍山市| 灌南县| 太谷县| 黄陵县| 剑川县| 定陶县| 西贡区| 静宁县| 滨州市| 碌曲县| 资源县| 同仁县| 长垣县| 福泉市| 盐池县| 吉林市|