您好,登錄后才能下訂單哦!
本篇文章給大家分享的是有關基于openLooKeng的交互式分析是怎樣的,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
在這個“信息爆炸”的時代,大數據已經成為這個時代的關鍵詞之一!隨著云計算、物聯網、移動計算、智慧城市、人工智能等領域日新月異的發展,人類社會已經步入了“信息高速路”的行駛軌道,數據量增長迅速,各類應用對大數據處理的需求也發生著變化。
與此同時,“久經沙場”的數據倉庫不再一統江湖,而以實時分析、離線分析、交互式分析等為代表的計算引擎勢頭迅猛。
華為云3年前發布的Serverless大數據分析服務 - 數據湖探索DLI,經過這幾年的迭代升級,已經包含用于實時分析的Flink引擎,用于離線分析的Spark引擎。今年基于華為開源openLooKeng引擎的交互式分析功能,也將于Q4重磅發布,便于用戶構建輕量級流、批、交互式全場景數據湖。
openLooKeng使用了業界著名的開源SQL引擎Presto來提供交互式查詢分析基礎能力,并繼續在融合場景查詢、跨數據中心/云、數據源擴展、性能、可靠性、安全性等方面發展,讓數據治理、使用更簡單。
DLI使用的openLooKeng引擎在內存計算框架的基礎上,還利用許多查詢優化技術來滿足高性能毫秒級的交互式分析的需要。
1.1 索引
openLooKeng提供基于Bitmap Index、Bloom Filter以及Min-max Index等索引。通過在現有數據上創建索引,并且把索引結果存儲在數據源外部,在查詢計劃編排時便利用索引信息過濾掉不匹配的文件,減少需要讀取的數據規模,從而加速查詢過程。
1.2 Cache
openLooKeng提供豐富多樣的Cache,包括元數據cache、執行計劃cache、ORC行數據cache等。通過這些多樣的cache,可加速用戶多次對同一SQL或者同一類型SQL的查詢時延響應。
1.3 動態過濾
所謂的動態過濾是指是在運行時(run time)將join一側表的過濾信息的結果應用到另一側表的過濾器的優化方法,openLooKeng不僅提供了多種數據源的動態過濾優化特性,還將這一優化特性應用到了DataCenter Connector,從而加速不同場景關聯查詢的性能。
1.4 算子下推
openLooKeng通過Connector框架連接到RDBMS等數據源時,由于RDBMS具有較強的計算能力,一般情況下將算子下推到數據源進行計算可以獲取到更好的性能。openLooKeng目前支持多種數據源的算子下推,包括Oracle、HANA等,特別地,針對DC Connector也實現了算子下推,從而實現了更快的查詢時延響應。
2.1 HA AA雙活
openLooKeng引入了高可用的AA特性,支持coordinator AA雙活機制,能夠保持多個coordinator之間的負載均衡,同時也保證了openLooKeng在高并發下的可用性。
2.2 Auto-scaling
openLooKeng的彈性伸縮特性支持將正在執行任務的服務節點平穩退服,同時也能將處于不活躍狀態的節點拉起并接受新的任務。openLooKeng通過提供“已隔離”與“隔離中”等狀態接口供外部資源管理者(如Yarn、Kubernetes等)調用,從而實現對coordinator和worker節點的彈性擴縮容。
實時分析、離線分析、交互式分析這三種場景中在很多實際業務中都是同時存在的,DLI引入openLooKeng引擎之初就考慮了如何跟已有的Spark引擎進行元數據層面的互通,從而實現離線分析結果,免數據搬遷直接就可以用openLooKeng引擎進行交互式分析。Spark和openLooKeng都支持Hive的建表方式,通過這種方式,實現了元數據層面的互通。
DLI老用戶使用比較多的功能是跨多種數據源的聯合查詢,用于更全面地對數據進行關聯分析,釋放數據價值。這次引入openLooKeng引擎將跨源查詢的能力進一步延伸,開發了跨域跨DC查詢的DataCenter Connector。通過這個新Connector可以連接到遠端另外的openLooKeng集群,從而提供在不同數據中心間協同計算的能力。 其中的關鍵技術如下:
4.1 并行數據訪問
worker可以并發訪問數據源以提高訪問效率, 客戶端也可以并發從服務端獲取數據以加快數據獲取速度。
4.2 數據壓縮
在數據傳輸期間進行序列化之前,先使用GZIP壓縮算法對數據進行壓縮,以減少通過網絡傳輸的數據量。
4.3 跨DC動態過濾
過濾數據以減少從遠端提取的數據量,從而確保網絡穩定性并提高查詢效率。
以上就是基于openLooKeng的交互式分析是怎樣的,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。