中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Storm任務平滑遷移至Flink的秘密是什么

發布時間:2021-10-20 18:08:54 來源:億速云 閱讀:221 作者:柒染 欄目:大數據

這篇文章將為大家詳細講解有關Storm任務平滑遷移至Flink的秘密是什么,文章內容質量較高,因此小編分享給大家做個參考,希望大家閱讀完這篇文章后對相關知識有一定的了解。

Flink-Storm 是 Flink 官方提供的用于 Flink 兼容 Storm 程序 beta 工具,并且在 Release 1.8 之后去掉相關代碼。主要講述 58 實時計算平臺如何優化 Flink-Storm 以及基于 Flink-Storm 實現真實場景下大規模 Storm 任務平滑遷移 Flink。

背景

58 實時計算平臺旨在為集團業務部門提供穩定高效實時計算服務,主要基于 Storm 和 Spark Streaming 構建,但在使用過程中也面臨一些問題,主要包括 Storm 在吞吐量不足以及多集群帶來運維問題,Spark Streaming 又無法滿足低延遲的要求。Apache Flink 開源之后,其在架構設計、計算性能和穩定性上體現出的優勢,使我們決定采用 Flink 作為新一代實時計算平臺的計算引擎。同時基于 Flink 開發了一站式高性能實時計算平臺 Wstream,支持 Flink jar,Stream Sql,Flink-Storm 等多樣化任務構建方式。

在完善 Flink 平臺建設的同時,我們也啟動 Storm 任務遷移 Flink 計劃,旨在提升實時計算平臺整體效率,減少機器成本和運維成本。

Storm vs Flink

Storm任務平滑遷移至Flink的秘密是什么

盡管 Flink 作為高性能計算引擎可以很好兼容 Storm,但在業務遷移過程中,我們仍然遇到了一些問題:

1 .用戶對 Flink 的學習成本;

  1. 重新基于 Flink 開發耗費工作量;

  2. Stream-SQL 雖然可以滿足快速開發減少學習成本和開發工作量但無法滿足一些復雜場景。

因此我們決定采用 Flink 官方提供的 Flink-Storm 進行遷移,在保障遷移穩定性同時無需用戶修改 Storm 代碼邏輯。

Flink-Storm 原理

Storm任務平滑遷移至Flink的秘密是什么

通過 Storm 原生 TopologyBuilder 構建好 Storm topology。
FlinkTopology.createTopology(builder) 將 StormTopology 轉換為 Flink 對應的 Streaming Dataflow。
SpoutWrapper 用于將 spout 轉換為 RichParallelSourceFunction,spout 的OutputFields轉換成 source 的T ypeInformation。
BoltWrapper 用于將 bolt 轉換成對應的 operator,其中 grouping 轉換為對 spout 的 DataStream 的對應操作。
構建完 FlinkTopology 之后,就可以通過 StreamExecutionEnvironment 生成 StreamGraph 獲取 JobGraph,之后將 JobGraph 提交到 Flink 運行時環境。

實踐

Flink-Storm 作為官方提供 Flink 兼容 Storm 程序為我們實現無縫遷移提供了可行性,但是作為 beta 版本,在實際使用過程中存在很多無法滿足現實場景的情況,主要包括版本,功能 bug,復雜邏輯兼容,無法支持 yarn 等,下面將主要分為平臺層面和用戶層面講述我們的使用和改進。

Storm任務平滑遷移至Flink的秘密是什么

平臺層面

1. 版本

當前線上使用 Apache Flink 1.6 版本,Flink-Storm 模塊基于 Storm 1.0 開發,我們平臺運行 Storm 版本為 0.9.5 和 1.2 。

1.1 對于 Storm 1.2 運行任務,Storm 1.0 API 完全兼容 1.2 版本,因此只需切換 Flink-Storm 模塊依賴的 storm-core 到 1.2.

Storm任務平滑遷移至Flink的秘密是什么

1.2 對于 Storm 0.9.5 任務,由于 Storm 1.0 API 無法兼容 0.9.5,需要修改依賴 storm-core 為 0.9.5,同時修改 Flink-Storm 模塊中所有與 Storm 相關的 API,主要是切換 package 路徑。

Storm任務平滑遷移至Flink的秘密是什么

1.3 重新構建 flink-storm 包 mvn clean package -Dmaven.test.skip=true -Dcheckstyle.skip=true

2.功能

2.1 傳遞語義保證

Storm 使用 ACK 機制來實現傳遞語義保證,我們沒有將 Storm 的 ACK 機制移植到Flink-Storm。因此,某些依賴 ACK 機制的功能會受到限制。比如,Kafka spout 將消費狀態存儲在 ZK,狀態的更新需要依賴 ACK 機制,tuple 樹結束后,spout 才會觸發狀態更新,表示這條消息已經被完全處理,從而實現 at least once 的傳遞保證。Storm 也提供了at most once 的支持,spout 發送消息后,無需等待 tuple 樹結束直接觸發狀態更新。我們使用了 Storm 的實現 at most once 的方式,在 Kafka spout 實現 at most once 的基礎上,通過實現 Flink Checkpoint 的狀態機制,實現了 Flink-storm 任務的 at least once。Storm 任務遷移到 Flink,傳遞保證不變。

Storm任務平滑遷移至Flink的秘密是什么

2.2 tick tuple 機制

Storm 使用 tick tuple 機制實現定時功能,消息超時重發、Bolt 定時觸發等功能都要依賴 tick tuple 機制。Storm 0.9.5 版本沒有實現窗口功能,用戶可以使用 tick tuple 機制簡單實現窗口功能。我們同樣為 Flink-Storm 增加了 tick tuple 機制的支持,使用方式也和 Storm 中使用方式一樣,配置 topology.tick.tuple. freq.secs 參數,即開啟了 tick tuple 功能。

Storm任務平滑遷移至Flink的秘密是什么

2.3 多輸入下 AllGrouping 支持

AllGrouping 分組方式對應于 Flink 是 Broadcast。如圖,bolt-1 有兩個輸入,這種情況下,原 flink-storm 的實現,spout-2 到 bolt-1 的數據分區的表現形式和Rebalance(Flink 術語)一樣,而不是 Broadcast。我們優化了這種場景,使其數據分組表現和 Storm 中是一樣的。

Storm任務平滑遷移至Flink的秘密是什么

3.Runtime

Flink-Storm 默認支持 local 和 standalong 模式任務提交,無法將任務提交到 yarn 集群,我們在建設 Flink 集群一開始就選擇了 yarn 模式,便于集群資源管理和統一實時計算平臺,因此需要自行實現支持 yarn 的 runtime 功能,這里主要涉及 yarn client 端設計。

YARN Client 實現機制

Storm任務平滑遷移至Flink的秘密是什么

整個模塊主要分為四個部分,其中 client 用于調用 Flink-Storm 程序轉化接口,得到 Flink jobGraph。配置參數用于初始化 Flink 及 yarn 相關配置,構建運行時環境,命令行工具主要用于更加靈活的管理。yarnClient 主要實現 ApplicationClientProtocol 接口,完成與 ResourceManager 與 ApplicationMaster 的交互,實現 Flink job 提交和監控。

Storm任務平滑遷移至Flink的秘密是什么

4.任務部署

為便于任務提交和集成到 Wstream 平臺,提供類似 Flink 命令行提交方式:

Storm任務平滑遷移至Flink的秘密是什么

用戶層面

1.maven 依賴

平臺將編譯好的包上傳到公司 maven 私服供用戶下載對應版本 Flink-Storm 依賴包:

Storm任務平滑遷移至Flink的秘密是什么

2.代碼改動

用戶需要將 Storm 提交任務的方式改成 Flink 提交,其他無需變動。

Storm任務平滑遷移至Flink的秘密是什么

總結

通過對 Fink-Storm 的優化和使用,我們已經順利完成多個 Storm 集群任務遷移和下線,在保障實時性及吞吐量的基礎上可以節約計算資源 40% 以上,同時借助 yarn 統一管理實時計算平臺無需維護多套 Storm 集群,整體提升了平臺資源利用率,減輕平臺運維工作量。

關于Storm任務平滑遷移至Flink的秘密是什么就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

五寨县| 竹溪县| 蒲江县| 越西县| 定西市| 红河县| 辽阳县| 长乐市| 绍兴县| 嵊泗县| 大城县| 双牌县| 陈巴尔虎旗| 绥化市| 南涧| 新泰市| 土默特右旗| 资溪县| 绥棱县| 衡山县| 体育| 蚌埠市| 马鞍山市| 剑河县| 万全县| 喀喇沁旗| 泌阳县| 郧西县| 青川县| 尼玛县| 曲松县| 华宁县| 汉寿县| 义乌市| 左云县| 武川县| 革吉县| 沂水县| 手游| 德令哈市| 中宁县|