您好,登錄后才能下訂單哦!
這篇文章主要介紹“TSDB的數據怎么利用Hadoop/spark集群做數據分析”,在日常操作中,相信很多人在TSDB的數據怎么利用Hadoop/spark集群做數據分析問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”TSDB的數據怎么利用Hadoop/spark集群做數據分析”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!
舉個栗子:
一個風機監測站,用TSDB來存儲風速的實時數據。大家知道,風速可是矢量數據,TSDB存儲了x軸和y軸的數據,需要對x和y軸的數據求矢量和才能得到風速。
TSDB中的原始數據用簡單的表格示意一下,就是如下:
背景就是這么簡單,我們就開始三步走啦。
一、下載Jar包。這個Jar包支持實現了一個TSDB的HiveStorageHandler,通過Hive CLI或Hue使用,支持對TSDB的讀取。如果是本地hive集群,請下載jar包到本地,如果使用百度MapReduce(BMR),請直接使用地址bos://iot-tsdb/hive-tsdb-handler-all.jar
二、Hadoop集群中加載Jar包,并初始化。
示例代碼如下:
上面的代碼由以下幾部分組成,
1、加載Jar包、創建表、設置storage為TSDBStorageHandler
2、初始化TSDB的參數。在TBLPROPERTIES中初始化在TSDB中用到的相關參數,如tsdb.metric_name、tsdb.timestamp_name、tsdb.field_names、tsdb.tag_keys初始化為TSDB中的值
三、通過SQL得到結果
上面的x軸和y軸的風速,需要計算矢量和拿到最后的風速,利用SQL和計算函數就很簡單啦
得到的結果如下:
到此,關于“TSDB的數據怎么利用Hadoop/spark集群做數據分析”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。