中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何分析Flink中的KeyBy

發布時間:2021-12-23 18:40:24 來源:億速云 閱讀:712 作者:柒染 欄目:大數據

如何分析Flink中的KeyBy,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

KeyBy算子:將數據流按照指定key進行分區(分組)

示例環境

java.version: 1.8.x
flink.version: 1.11.1

 示例數據源 (項目碼云下載)

Flink 系例 之 搭建開發環境與數據

KeyBy.java

package com.flink.examples.functions;

import com.flink.examples.DataSource;
import org.apache.flink.api.java.functions.KeySelector;
import org.apache.flink.api.java.tuple.Tuple3;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.datastream.KeyedStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import java.util.List;

/**
 * @Description KeyBy算子:將數據流按照指定key進行分區
 */
public class KeyBy {

    /**
     * 遍歷集合,將用戶按性別分成兩類
     * @param args
     * @throws Exception
     */
    public static void main(String[] args) throws Exception {
        final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        //如果有多個分區,則設置并行度需大于1,或者在算子上設置setParallelism(2)前行度,否則算子只有一個并行度,則計算結果始終只有一個分區
//        env.setParallelism(4);
        List<Tuple3<String,String,Integer>> tuple3List = DataSource.getTuple3ToList();
        DataStream<Tuple3<String,String,Integer>> dataStream = env.fromCollection(tuple3List);
        //注意:使用Integer進行分區時,會導致分區結果不對,轉換成String類型輸出key即可正確輸出
        KeyedStream<Tuple3<String,String,Integer>, String> keyedStream = dataStream.keyBy(new KeySelector<Tuple3<String,String,Integer>, String>() {
            @Override
            public String getKey(Tuple3<String, String, Integer> tuple3) throws Exception {
                //f1為性別字段,以相同f1值(性別)進行分區
                return String.valueOf(tuple3.f1);
            }
        });

        //lambda
//        KeyedStream<Tuple3<String,String,Integer>, String> keyedStream = dataStream.keyBy((KeySelector<Tuple3<String, String, Integer>, String>) t3 -> t3.f1);
        //指定第幾個字段做為key進行計算
//        KeyedStream<Tuple3<String,String,Integer>, Tuple> keyedStream = dataStream.keyBy(1);
        keyedStream.print().setParallelism(4);
        env.execute("flink keyBy job");
    }
}

打印結果

2> (張三,man,20)
4> (李四,girl,24)
2> (王五,man,29)
4> (劉六,girl,32)
2> (吳八,man,30)
4> (伍七,girl,18)

關于如何分析Flink中的KeyBy問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業資訊頻道了解更多相關知識。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

博罗县| 长垣县| 瑞安市| 平凉市| 军事| 丽江市| 遵化市| 前郭尔| 富顺县| 庐江县| 尼玛县| 梅河口市| 水富县| 林西县| 衡东县| 景谷| 奉化市| 大田县| 开平市| 长寿区| 义乌市| 洞头县| 浠水县| 来凤县| 邹平县| 萨嘎县| 松潘县| 都江堰市| 长垣县| 临海市| 望都县| 和田市| 威远县| 阿拉善右旗| 彰武县| 左云县| 贡山| 邹平县| 涿鹿县| 南城县| 丁青县|