您好,登錄后才能下訂單哦!
這篇文章將為大家詳細講解有關k8s node alertmanager監控報警配置方法是什么,文章內容質量較高,因此小編分享給大家做個參考,希望大家閱讀完這篇文章后對相關知識有一定的了解。
節點本身的監控主要監控CPU、內存、磁盤IO、文件系統可用空間即可。
比如,對于使用來prometheus的alertmanager來做node報警,rules配置可以參考如下點進行配置即可。
不同的node-exporter版本,對應的metrics也不一樣,需要自己對照更改一下。
(1 - avg(irate(node_cpu{mode="idle"}[10m])) by (instance)) * 100 < 90
((node_memory_MemTotal - node_memory_MemFree) / node_memory_MemTotal) * 100 < 90
(max(avg(irate(node_disk_io_time_ms[10m])) by (instance, device)) by (instance))/10
max(((node_filesystem_size{fstype=~"ext4|vfat"} - node_filesystem_free{fstype=~"ext4|vfat"}) / node_filesystem_size{fstype=~"ext4|vfat"}) * 100) by (instance) > 90
關于k8s node alertmanager監控報警配置方法是什么就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。