中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

spark概述與編程模型

發布時間:2020-08-26 21:39:16 來源:網絡 閱讀:710 作者:jethai 欄目:大數據


spark快的原因
1.內存計算

2.DAG


spark shell已經初始化好了SparkContext,直接用sc調用即可



spark概述與編程模型


lineage 血統

RDD wide and narrow dependencies

窄依賴每個 RDD partition最多被一個子RDD partirion依賴


spark概述與編程模型


/sbin(system binary)放的都是涉及系統管理的命令。
有些系統里面,普通用戶沒有執行這些命令的權限。
有些系統里面,普通用戶的PATH不包括/sbin



data.cache  數據放到內存中

spark-submit提交任務

spark概述與編程模型


scala代碼

package cn.chinahadoop.spark

import org.apache.spark.{SparkContext, SparkConf}
import scala.collection.mutable.ListBuffer
import org.apache.spark.SparkContext._

/**
 * Created by chenchao on 14-3-1.
 */
class Analysis {

}

object Analysis{

  def main(args : Array[String]){

    if(args.length != 2){
      println("Usage : java -jar code.jar  file_location save_location")
      System.exit(0)
    }

   

    val conf = new SparkConf()
    conf.setSparkHome("/data/software/crazyjvm/spark")
     

    val sc = new SparkContext(conf)
    val data = sc.textFile(args(0))

    data.cache

    println(data.count)

    data.filter(_.split(' ').length == 3).map(_.split(' ')(1)).map((_,1)).reduceByKey(_+_)
    .map(x => (x._2, x._1)).sortByKey(false).map( x => (x._2, x._1)).saveAsTextFile(args(1))
  }

}


向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

柳林县| 吴桥县| 合阳县| 嵊州市| 渭南市| 筠连县| 吉林市| 迁安市| 洪湖市| 东辽县| 汕尾市| 台南市| 新沂市| 高唐县| 弥渡县| 买车| 昆山市| 西华县| 茶陵县| 中江县| 乌鲁木齐市| 黔西| 通州区| 航空| 富民县| 水城县| 宿松县| 崇礼县| 马龙县| 武夷山市| 牙克石市| 卓资县| 合川市| 德惠市| 屯昌县| 东阳市| 会宁县| 牡丹江市| 青海省| 阿城市| 莱阳市|