中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

HBase 運維中生產上怎樣解決HBase RIT問題

發布時間:2021-12-06 10:27:28 來源:億速云 閱讀:761 作者:柒染 欄目:大數據

HBase 運維中生產上怎樣解決HBase RIT問題,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

1.現象:

昨晚集群夯住,內存不夠,導致HBase RegionServer掛了!
緊跟著CDH HBase Master(active)節點是紅色的,顯示信息:HBase Regions In Transition Over Threshold
這時我知道又遇見HBase RIT了。

2.常見解決方法:

2.1 重啟HBase,嘗試了2次后,發現HBase Master(active)節點是依舊紅色的

雖然我們可以連接HBase,但是查詢速度(dbeaver工具+Phoenix)上是非常慢的,
還拋錯一個錯誤: Cache of region boundaries are out of date.
HBase 運維中生產上怎樣解決HBase RIT問題

2.2 在master節點:使用hbase進程所在的用戶

su - hbase
hbase hbck -fixAssignments 
用于修復region assignments錯誤,觀察發現越來越多的RIT的Regions,及時終止命令
也嘗試了一下 hbase hbck、hbase hbck -repair,日志刷了很久也沒解決。

2.3 查看master節點日志,發現如下日志

2018-08-21 09:50:47,924 INFO org.apache.hadoop.hbase.master.SplitLogManager: total tasks = 1 unassigned = 0 tasks={/hbase/splitWAL/WALs%2Fhadoop49%2C60020%2C1534734073978-splitting%2Fhadoop49%252C60020%252C1534734073978.null0.1534762936638=last_update = 1534816154977 last_version = 22 cur_worker_name = hadoop47,60020,1534815723497 status = in_progress incarnation = 2 resubmits = 2 batch = installed = 1 done = 0 error = 0}

由于日志刷的很快,加上是info級別,剛開始真心沒注意!
后來通過分析HBase master web界面,發現:

  • a.RIT的regions都是在hadoop49機器

  • b.master的log日志也是顯示hadoop49機器的splitting log,

    一直在in_progress狀態
    (觀察差不多10分鐘,一直再刷info級別且此狀態)

HBase 運維中生產上怎樣解決HBase RIT問題

3.暴力解決:

3.1 直接使用hdfs命令先找到日志,再rm刪除(移除到回收站)

hadoop36:hdfs:/var/lib/hadoop-hdfs:>hdfs dfs -ls hdfs://nameservice1/hbase/WALs/*splitting
Found 1 items
-rw-r--r--   3 hbase hbase   21132987 2018-08-20 19:02 hdfs://nameservice1/hbase/WALs/hadoop49,60020,1534734073978-splitting/hadoop49%2C60020%2C1534734073978.null0.1534762936638
hadoop36:hdfs:/var/lib/hadoop-hdfs:>
hadoop36:hdfs:/var/lib/hadoop-hdfs:>
hadoop36:hdfs:/var/lib/hadoop-hdfs:>hdfs dfs -rm hdfs://nameservice1/hbase/WALs/hadoop49,60020,1534734073978-splitting/hadoop49%2C60020%2C1534734073978.null0.1534762936638
18/08/21 12:46:15 INFO fs.TrashPolicyDefault: Moved: 'hdfs://nameservice1/hbase/WALs/hadoop49,60020,1534734073978-splitting/hadoop49%2C60020%2C1534734073978.null0.1534762936638' to trash at: hdfs://nameservice1/user/hdfs/.Trash/Current/hbase/WALs/hadoop49,60020,1534734073978-splitting/hadoop49%2C60020%2C1534734073978.null0.1534762936638
hadoop36:hdfs:/var/lib/hadoop-hdfs:>

3.2 重啟HBase,等待一會,一切正常,保證HBase對外提供服務。3.3 因為我們刪除的是HLOG文件,必然會丟失數據,故使用MCP實時中間件,web界面定制數據重刷job(昨晚19:00~21:00故障范圍時間),恢復數據。

關于HBase 運維中生產上怎樣解決HBase RIT問題問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業資訊頻道了解更多相關知識。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

康马县| 辰溪县| 太湖县| 九台市| 昭觉县| 西乡县| 柳江县| 汕头市| 宝山区| 翁牛特旗| 阿尔山市| 类乌齐县| 余庆县| 大冶市| 和硕县| 兰州市| 同德县| 张家港市| 海原县| 曲周县| 樟树市| 越西县| 积石山| 江阴市| 如皋市| 大丰市| 汾西县| 珠海市| 商水县| 临安市| 南皮县| 西乡县| 鄄城县| 上犹县| 襄樊市| 屯留县| 玉溪市| 泌阳县| 麟游县| 曲靖市| 双鸭山市|