中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

spark寫orc格式文件

發布時間:2020-07-24 12:11:01 來源:網絡 閱讀:8216 作者:xiaobin0303 欄目:大數據
  1. 在hive中建表格式存儲格式為orc

      create table user(id int,name string) stored as orc;  

  2. spark寫文件        

    val jsons = "hdfs://localhost:9000/test/artist_orc.json"
    val people = sc.textFile(jsons)
    val schemaString = "id name"
    val schema = StructType(schemaString.split(" ").map(fieldName => {if(fieldName == "name")
      StructField(fieldName, StringType, true) else StructField(fieldName, IntegerType, true)}))

    val rowRDD = people.map(line=>{
      JSONObject.fromObject(line)
    }).map(p => Row(new Integer(p.get("id").toString), p.get("name")))

    val hiveContext = new org.apache.spark.sql.hive.HiveContext(sc)
    val peopleSchemaRDD = hiveContext.createDataFrame(rowRDD, schema)
    peopleSchemaRDD.write.format("orc").save("hdfs://localhost:9000/user/xb/warehouse/artist_orc/adf")


向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

资讯| 淮安市| 恩平市| 咸阳市| 凤台县| 新化县| 克什克腾旗| 长兴县| 绥宁县| 长宁区| 沽源县| 平南县| 汤原县| 比如县| 连城县| 宽城| 平舆县| 乌兰县| 馆陶县| 华阴市| 河东区| 枝江市| 雷波县| 曲沃县| 嫩江县| 大庆市| 梁山县| 岱山县| 桐乡市| 遂昌县| 凤台县| 武邑县| 昌都县| 广西| 渭源县| 株洲市| 平湖市| 涿州市| 宁陕县| 竹山县| 武穴市|