中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Kubernetes如何助力Spark大數據分析

發布時間:2021-12-16 21:53:35 來源:億速云 閱讀:131 作者:柒染 欄目:云計算

這期內容當中小編將會給大家帶來有關Kubernetes如何助力Spark大數據分析,文章內容豐富且以專業的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

Kubernetes如何助力Spark大數據分析

概述

本文為大家介紹一種容器化的數據服務Spark + OSS on ACK,允許Spark分布式計算節點對阿里云OSS對象存儲的直接訪問。借助阿里云Kubernetes容器服務與阿里云OSS存儲資源的深度整合,允許Spark分布式內存計算,機器學習集群對云上的大數據直接進行分析和保存結果。

先決條件

  1. 你已經通過阿里云容器服務創建了一個Kubernetes集群,詳細步驟參見創建Kubernetes集群

從容器服務控制臺創建一個Spark OSS實例

使用三次點擊來創建一個1 master + 3 worker 的Spark OSS的實例

1 登錄 https://cs.console.aliyun.com/
2 點擊 “應用目錄”
3 選擇 "spark-oss", 點擊 “參數”

給你的應用一個名字, e.g. spark-oss-online2

(必選)填寫你的oss_access_key_id和oss_access_key_secret

Worker:
 # set OSS access keyID and secret
  oss_access_key_id: <Your sub-account>
  oss_access_key_secret: <your key_secret of sub-account>

(可選)修改工作節點數目 Worker.Replicas: 


4 點擊 “部署”
5 點擊 “Kubernetes 控制臺”,查看部署實例

6 點擊 服務, 查看外部端點, 點擊URL訪問Spark集群




7 測試Spark集群

  1. 打開一個spark-shell

kubectl get pod | grep worker

spark-oss-online2-worker-57894f65d8-fmzjs 1/1 Running 0 44m

spark-oss-online2-worker-57894f65d8-mbsc4 1/1 Running 0 44m
spark-oss-online2-worker-57894f65d8-zhwr4 1/1 Running 0 44m

kubectl exec -it spark-oss-online2-worker-57894f65d8-fmzjs --  /opt/spark/bin/spark-shell --master spark://spark-oss-online2-master:7077
  1. 粘貼下列代碼,使用Spark測試OSS的讀寫性

// Save RDD to OSS bucket
val stringRdd = sc.parallelize(Seq("Test Strings\n Test String2"))
stringRdd.saveAsTextFile("oss://eric-new/testwrite12")

// Read data from OSS bucket
val lines = sc.textFile("oss://eric-new/testwrite12")
lines.take(10).foreach(println)

Test Strings
Test String2

CLI 命令行操作

Setup keys and deploy spark cluster in one command
export OSS_ID=<your oss id>
export OSS_SECRET=<your oss secrets>

helm install -n myspark-oss --set "Worker.oss_access_key_id="$OSS_ID",Worker.oss_access_key_secret="$OSS_SECRET incubator/spark-oss
kubectl get svc| grep oss
myspark-oss-master   ClusterIP      172.19.9.111    <none>          7077/TCP         2m
myspark-oss-webui    LoadBalancer   172.19.13.1     120.55.104.27   8080:30477/TCP   2m

上述就是小編為大家分享的Kubernetes如何助力Spark大數據分析了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關知識,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

商都县| 青冈县| 云龙县| 耿马| 阳原县| 蚌埠市| 海阳市| 上栗县| 瑞金市| 长治县| 姚安县| 崇义县| 轮台县| 吉水县| 万全县| 南城县| 陵水| 梁平县| 固阳县| 太康县| 天津市| 郁南县| 秦安县| 惠安县| 咸宁市| 渝中区| 隆尧县| 永清县| 抚顺市| 泰顺县| 新安县| 齐河县| 马鞍山市| 沐川县| 雷波县| 江永县| 长沙市| 封丘县| 苏尼特右旗| 台南县| 景洪市|