Готовые запросы для ежедневного мониторинга Linux-сервера.

# CPU usage (%), усреднение за 5 минут
100 - (avg by(instance) (rate(node_cpu_seconds_total{mode="idle"}[5m])) * 100)

# RAM: занято (bytes)
node_memory_MemTotal_bytes - node_memory_MemAvailable_bytes

# Диск: % использования по точкам монтирования
100 - (node_filesystem_avail_bytes{fstype!="tmpfs"} / node_filesystem_size_bytes * 100)

# Сеть: входящий трафик (bytes/s)
rate(node_network_receive_bytes_total{device!="lo"}[5m])

# Load average > количества ядер (перегрузка)
node_load1 > on(instance) count by(instance)(node_cpu_seconds_total{mode="idle"})

Все запросы работают со стандартным node_exporter без дополнительных метрик. Последний — алерт-условие для перегруженного хоста.

#prometheus #promql #monitoring #node_exporter #linux