中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

spark性能優化要注意哪幾點

發布時間:2021-12-17 14:03:24 來源:億速云 閱讀:161 作者:柒染 欄目:大數據

spark性能優化要注意哪幾點,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。

一.優化方向,序列化

1.官網位置

spark性能優化要注意哪幾點

2.解釋:

默認用的是java序列化,但是會很慢,第二種很快,但是不一定能實現所有序列化
第二種,有些自定義類你需要在代碼中注冊(Kryo)

3.StorageLevel.MEMORY_ONLY) 方式存儲代碼

  def main(args: Array[String]) {
    val sparkConf = new SparkConf()
    val sc = new SparkContext(sparkConf)
    val names = Array[String]("G304","G305","G306")
    val genders = Array[String]("male","female")
    val addresses = Array[String]("beijing","shenzhen","wenzhou","hangzhou")
    val infos = new ArrayBuffer[Info]()
    for (i<-1 to 1000000){
      val name = names(Random.nextInt(3))
      val gender = genders(Random.nextInt(2))
      val address = addresses((Random.nextInt(4)))
      infos += Info(name, gender, address)
    }
    val rdd = sc.parallelize(infos)
    rdd.persist(StorageLevel.MEMORY_ONLY_SER)
    rdd.count()
    // rdd.persist(StorageLevel.MEMORY_ONLY)
    sc.stop()
  }
  case class Info(name:String, gender:String, address:String)
}

4.結果34.3 java序列化默認

spark性能優化要注意哪幾點

二.Kyro序列化

1.配置文件位置及配置(spark.serialize)在spark-default.conf

spark性能優化要注意哪幾點

2.代碼

 def main(args: Array[String]) {
    val sparkConf = new SparkConf()
    sparkConf.registerKryoClasses(Array(classOf[Info]))
    val sc = new SparkContext(sparkConf)
    val names = Array[String]("G304","G305","G306")
    val genders = Array[String]("male","female")
    val addresses = Array[String]("beijing","shenzhen","wenzhou","hangzhou")
    val infos = new ArrayBuffer[Info]()
    for (i<-1 to 1000000){
      val name = names(Random.nextInt(3))
      val gender = genders(Random.nextInt(2))
      val address = addresses((Random.nextInt(4)))
      infos += Info(name, gender, address)
    }
    val rdd = sc.parallelize(infos)
    rdd.persist(StorageLevel.MEMORY_ONLY_SER)
    rdd.count()
    // rdd.persist(StorageLevel.MEMORY_ONLY_SER)
    sc.stop()

3.沒注冊情況下截圖

spark性能優化要注意哪幾點

4.官網沒注冊結果

spark性能優化要注意哪幾點

5.加上一句話,否則所有的東西都要加入變大

sparkConf.registerKryoClasses(Array(classOf[Info]))

看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

刚察县| 友谊县| 屏山县| 疏勒县| 安塞县| 昌邑市| 大姚县| 中方县| 淮安市| 五指山市| 炉霍县| 舞钢市| 乌什县| 高安市| 黎平县| 湘西| 新巴尔虎右旗| 海安县| 连云港市| 双桥区| 南漳县| 皋兰县| 阿城市| 桐庐县| 黄浦区| 兰溪市| 屏东县| 龙胜| 北海市| 淅川县| 新巴尔虎右旗| 抚州市| 阿拉善左旗| 富蕴县| 桐梓县| 宝清县| 兰州市| 通城县| 哈巴河县| 泗阳县| 平安县|