中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎樣實現Pulsar與Kafka消費模型對比

發布時間:2021-12-15 09:45:04 來源:億速云 閱讀:188 作者:柒染 欄目:大數據

這期內容當中小編將會給大家帶來有關怎樣實現Pulsar與Kafka消費模型對比,文章內容豐富且以專業的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

kafka

kafka 屬于 Stream 的消費模型,為了支持多 partition 的消費關系,引入了 consumer group 的概念,同時支持在消費端動態的 reblance 操作,當多個 Consumer 訂閱了同一個 Topic 時,會根據分區策略進行消費者訂閱分區的重分配。只要 consumer-group 與 topic 之間的關系發生變更,就會動態觸發 reblance 操作,諸如:

  • 增加或減少 topic 中 partition 的數目

  • consumer-group 中的 consumer 數減少

  • consumer-group 與 topic 之間的訂閱關系發生變更

  • 等等

引入 reblance 的好處在于,當訂閱關系發生變更時,用戶無需重新啟動系統,就可以實現訂閱關系的變更,相當于 kafka 將這種分配的權利從服務端下放到客戶端中的 consumer 來管理,這樣用戶就可以自定義自己的分配方案。

pulsar

類似 kafka 這樣的 Stream MQ,更多時候適合做離線業務的處理與分析,很多線上業務會使用 Active MQ 這樣 Queue 的 MQ。為了同時兼容這兩種消費模型,pulsar 做了一層消費層的抽象,統一了 Queue 和 Stream 這兩種消費模型。

其中,Exclusive 和 Failover 屬于 Stream 的消費模型,Share 屬于 Queue 的消費模型。在寫此文章時,pulsar 最新版本為 2.3.1,Key_Shared 屬于pulsar 新增加的一種訂閱模型,在之后的文章中,我們會單獨對 Key_shared 訂閱模型做單獨的分享,這里不在贅述。

對 Stream 支持的對比

由于 kafka 不支持 Queue 類型的消費模型,所以 Share 這種形式在這里不做對比。下面,和大家一起討論以下在 Stream 下 pulsar 與 kafka 的消費模型。

如下圖所示,左邊為 pulsar 在 Failover 和 Exclusive 下的消費情況,右邊為 kafka 的消費模型。

假設目前有一個 topic,topic name 為 topic1,有 5 個partition,分別為:topic1-p1,topic1-p2,topic1-p3,topic1-p4,topic1-p5,在 kafka 中,使用了 consumer-group 且該 group 下有三個 consumer,上文中提到,kafka 支持 reblance 機制,所以當 consumer-2 與 consumer-3 加入 consumer-group 的過程中,會動態分攤之前 consumer-1 的消費壓力,表現為如上圖右半部分所示,cousumer-1 消費 topic1-p1 和 ropic1-p2,consumer-2 消費 topic1-p3 和 topic1-p4,consumer-3 消費 topic1-p5 。所以當用戶不斷的往 consumer-group 中添加 consumer 時,利用 kafka 的 reblance 機制,是可以讓用戶動態指定具體哪一個 consumer 來消費 topic1 中的哪些 partition。

在 pulsar 中,你可以將 subscribe 理解為 kafka 中的 consumer-group,如果用戶在啟動 consumer 時,指定的 subscribe-name 是相同的,說明這兩個 consumer 屬于同一個訂閱組,代碼示例如下:


Consumer<byte[]> consumer1 = pulsarClient.newConsumer().topic("topic-1").subscriptionName("my-subscriber-name")                .subscriptionType(SubscriptionType.Failover)                .subscribe();
Consumer<byte[]> consumer2 = pulsarClient.newConsumer().topic("topic-2").subscriptionName("my-subscriber-name")                .subscriptionType(SubscriptionType.Failover)                .subscribe();

如上圖示例所示,在同一個訂閱組下,啟動三個 consumer,在 pulsar 中,每一個 consumer 都會去訂閱 topic1 中的 5 個 partition,所以每個 consumer 都會去啟動 5 個 sub-consumer,在 failover 的訂閱模型下,會使用 hashcode 的形式,將 5 個 partition 分配給三個 consumer 來消費,pulsar 將當前正在消費的 sub-consumer 看作是處于 leader 狀態的 consumer,剩余未工作的 sub-consumer 作為從節點,當 leader 狀態的 consumer 由于某些原因無法工作時,處于從狀態的 sub-consumer 會去接替 leader 的 consumer,并繼續工作。可以發現,kafka 加入 reblance 的機制,允許用戶自己指定哪些 consumer 來消費 哪些 partition,在 pulsar 中,這個工作由 failover 的機制來完成,它通過 hash 的形式,將 consumer 分配到不同的 sub-consumer 中來執行。

現在,驗證一下上述所描述的內容。

場景一

1. 以 standalone 的形式啟 pulsar

$ docker run -it \  -p 6650:6650 \  -p 8080:8080 \  -v $PWD/pulsardata:/pulsar/data \  apachepulsar/pulsar:2.3.0 \  bin/pulsar standalone

2. 創建一個 topic,partition 的數目為 4


$ ./bin/pulsar-admin topics mytopic1 create-partitioned-topic -p 4

以 failover 的訂閱類型,啟動 3 個 consumer,并指定他們為同一個訂閱組,即-s sub-1

$ ./bin/pulsar-client consume mytopic1 -s sub-1 -n 0 -t Failover

3. 啟動 producer,發送 10 條數據到 mytopic1

$ ./bin/pulsar-client produce mytopic1 -n 10 -m "hello-pulsar"

可以看到,consumer1 接收到 2 條消息,consumer2 接收到 5 條消息,consumer3 接收到 3 條消息。效果和我們所預期的是一致的。

上述情況是因為在 producer 發送之前,就已經啟動好三個 consumer 來消費消息,所以 pulsar 會以 hash 的形式將消息分發到三個 consumer 中來消費。

場景二

Exclusive 的訂閱形式啟動兩個 consumer,效果如下:

./bin/pulsar-client consume mytopic1 -s sub-1 -n 0 -t Exclusive

當啟動 consumer2 時,會報錯 Exclusive consumer is already connected,這是因為,Failover 的訂閱模式下,其它的 consumer 會以 “從” consumer 的形態存在,但是 Exclusive 只允許一個 consumer 訂閱一個 topic。

上述就是小編為大家分享的怎樣實現Pulsar與Kafka消費模型對比了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關知識,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

兴化市| 永川市| 泾阳县| 浦城县| 屯门区| 凉城县| 崇文区| 藁城市| 绵竹市| 遂平县| 长海县| 屏东县| 沈阳市| 北海市| 六枝特区| 山西省| 浙江省| 上蔡县| 剑阁县| 清原| 乐亭县| 新巴尔虎右旗| 武冈市| 安西县| 紫云| 沙雅县| 宾阳县| 宁明县| 忻城县| 吉林省| 汉阴县| 定陶县| 龙胜| 平昌县| 永安市| 太原市| 云阳县| 敦化市| 贡觉县| 永城市| 南充市|