中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

spark分組取 topN

發布時間:2020-08-24 18:19:05 來源:網絡 閱讀:900 作者:惡魔蘇醒ing 欄目:大數據

SPARK用scala實現分組取topN

原文件:

class1 33

class2 56

class1 87

class2 77

class1 76

class2 88

class1 95

class1 74

class2 85

class2 67

class2 77

class1 99

class1 59

class2 60

import org.apache.spark.SparkConf

import org.apache.spark.SparkContext

import org.apache.commons.collections.map.Flat3Map


object GroupTopN {

  

  def main(args: Array[String]): Unit = {

    

          val conf = new SparkConf()

                  .setAppName("TopN")

                  .setMaster("local")

          val sc = new SparkContext(conf)

          val lines = sc.textFile("C://Users//Administrator//Desktop//spark//groupTopN.txt", 1)

          val pairs = lines.map { line => line.split(" ")}

          val xx = pairs.map { pair => (pair(0),pair(1).toInt) }

          val sort = xx.groupByKey()

          val result = sort.map(s=>(s._1,s._2.toList.sorted(Ordering.Int).take(4)))

          result.foreach(r => println(r._1+""+r._2))       

  }

  

}


向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

什邡市| 日喀则市| 苏尼特右旗| 台南县| 麻阳| 南投县| 清涧县| 海原县| 竹溪县| 汤原县| 文安县| 渭源县| 烟台市| 商洛市| 虞城县| 南涧| 五常市| 巴中市| 青阳县| 当雄县| 黄浦区| 郧西县| 鹤峰县| 错那县| 雅江县| 梧州市| 南丹县| 乌兰县| 曲靖市| 阳山县| 北海市| 林州市| 安庆市| 罗源县| 安平县| 晋宁县| 绍兴市| 互助| 如东县| 遵化市| 南昌市|