中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

生產常用Spark累加器剖析之三(自定義累加器)

發布時間:2020-06-13 10:41:43 來源:網絡 閱讀:477 作者:Stitch_x 欄目:大數據

思路 & 需求

參考IntAccumulatorParam的實現思路(上述文章中有講):

trait AccumulatorParam[T] extends AccumulableParam[T, T] {
  def addAccumulator(t1: T, t2: T): T = {
    // addInPlace有很多具體的實現類
    // 如果想要實現自定義的話,就得實現這個方法
    addInPlace(t1, t2)
  }
}

自定義也可以通過這個方法去實現,從而兼容我們自定義的累加器

需求:這里實現一個簡單的案例,用分布式的方法去實現隨機數

**
  * 自定義的AccumulatorParam
  *
  * Created by lemon on 2018/7/28.
  */
object UniqueKeyAccumulator extends AccumulatorParam[Map[Int, Int]] {
  override def addInPlace(r1: Map[Int, Int], r2: Map[Int, Int]): Map[Int, Int] = {
      // ++用于兩個集合相加
      r1++r2
    }
    override def zero(initialValue: Map[Int, Int]): Map[Int, Int] = {
      var data: Map[Int, Int] = Map()
      data
    }
}
/**
  * 使用自定義的累加器,實現隨機數
  *
  * Created by lemon on 2018/7/28.
  */
object CustomAccumulator {
  def main(args: Array[String]): Unit = {
    val sparkConf = new SparkConf().setAppName("CustomAccumulator").setMaster("local[2]")
    val sc = new SparkContext(sparkConf)
    val uniqueKeyAccumulator = sc.accumulable(Map[Int, Int]())(UniqueKeyAccumulator)
    val distData = sc.parallelize(1 to 10)
    val mapCount = distData.map(x => {
      val randomNum = new Random().nextInt(20)
      // 構造一個k-v對
      val map: Map[Int, Int] = Map[Int, Int](randomNum -> randomNum)
      uniqueKeyAccumulator += map
    })
    println(mapCount.count())
    // 獲取到累加器的值 中的key值,并進行打印
    uniqueKeyAccumulator.value.keys.foreach(println)
    sc.stop()
  }
}

運行結果如下圖:## 思路 & 需求

參考IntAccumulatorParam的實現思路(上述文章中有講):

trait AccumulatorParam[T] extends AccumulableParam[T, T] {
  def addAccumulator(t1: T, t2: T): T = {
    // addInPlace有很多具體的實現類
    // 如果想要實現自定義的話,就得實現這個方法
    addInPlace(t1, t2)
  }
}

自定義也可以通過這個方法去實現,從而兼容我們自定義的累加器

需求:這里實現一個簡單的案例,用分布式的方法去實現隨機數

**
  * 自定義的AccumulatorParam
  *
  * Created by lemon on 2018/7/28.
  */
object UniqueKeyAccumulator extends AccumulatorParam[Map[Int, Int]] {
  override def addInPlace(r1: Map[Int, Int], r2: Map[Int, Int]): Map[Int, Int] = {
      // ++用于兩個集合相加
      r1++r2
    }
    override def zero(initialValue: Map[Int, Int]): Map[Int, Int] = {
      var data: Map[Int, Int] = Map()
      data
    }
}
/**
  * 使用自定義的累加器,實現隨機數
  *
  * Created by lemon on 2018/7/28.
  */
object CustomAccumulator {
  def main(args: Array[String]): Unit = {
    val sparkConf = new SparkConf().setAppName("CustomAccumulator").setMaster("local[2]")
    val sc = new SparkContext(sparkConf)
    val uniqueKeyAccumulator = sc.accumulable(Map[Int, Int]())(UniqueKeyAccumulator)
    val distData = sc.parallelize(1 to 10)
    val mapCount = distData.map(x => {
      val randomNum = new Random().nextInt(20)
      // 構造一個k-v對
      val map: Map[Int, Int] = Map[Int, Int](randomNum -> randomNum)
      uniqueKeyAccumulator += map
    })
    println(mapCount.count())
    // 獲取到累加器的值 中的key值,并進行打印
    uniqueKeyAccumulator.value.keys.foreach(println)
    sc.stop()
  }
}

運行結果如下圖:
生產常用Spark累加器剖析之三(自定義累加器)

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

隆回县| 洛川县| 调兵山市| 绥芬河市| 永昌县| 越西县| 永胜县| 文化| 昌平区| 昆山市| 汤原县| 华阴市| 平昌县| 翁牛特旗| 油尖旺区| 治县。| 延寿县| 宜城市| 安康市| 肥东县| 望城县| 澄迈县| 中宁县| 东辽县| 象山县| 将乐县| 林口县| 龙江县| 沽源县| 新竹县| 铜川市| 裕民县| 北海市| 枞阳县| 宝坻区| 盐津县| 永善县| 满洲里市| 两当县| 雷州市| 沂南县|