中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Spark2.3.1使用技巧是什么樣的

發布時間:2021-12-17 10:06:38 來源:億速云 閱讀:115 作者:柒染 欄目:大數據

本篇文章給大家分享的是有關Spark2.3.1使用技巧是什么樣的,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

Spark 2.3.1 使用技巧

Spark-SQL 讀取JSON文件時反射表頭

case class StudentInfo(id:Long,name:String,age:Int)

val example = spark.read.json("/data/result.json").as(StudentInfo)
example.show()

動態定義schema

在需要根據不同數據定義不同schema

val schemaInfo = "name age"
val fields = schemaInfo.map(item=> item.split(" ")
     .map(item=>StructField(item,StringType,nullable=true))
val schema = StructType(fields)

val rowRDD = peopleRDD.map(_.split(" ").map(attributes=>Row(attributes(0),attributes(1))

val peopleDF = spark.createDataFrame(rowRDD,schema)

peopleDF.show()

Spark 2.3.1 on YARN

spark-submit 限制參數未生效

因為在spark-submit時配置的executor-memory 2g等沒有生效,后來問同事說他也碰到這樣的問題,解決方案就是動態的分配executor

--conf spark.yarn.maxAppAttempts=1 --conf spark.dynamicAllocation.minExecutors=2 --conf spark.dynamicAllocation.maxExecutors=4 --conf spark.dynamicAllocation.initialExecutors=4

以上就是Spark2.3.1使用技巧是什么樣的,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

揭西县| 富顺县| 方正县| 图木舒克市| 泾阳县| 德江县| 泸州市| 曲周县| 岚皋县| 田阳县| 汾阳市| 镇原县| 长海县| 岐山县| 行唐县| 洛阳市| 赤水市| 南投县| 龙岩市| 平乐县| 双柏县| 都匀市| 皋兰县| 宁德市| 新巴尔虎左旗| 贵州省| 精河县| 资讯| 宁海县| 和林格尔县| 镇江市| 游戏| 松潘县| 信丰县| 双辽市| 观塘区| 井研县| 青冈县| 尖扎县| 兴安盟| 阿坝县|