Prometheus + Grafana

Prometheus + Grafana

Pull-модель метрик и визуализация в реальном времени — стек наблюдаемости, на котором работает облако.

«Prometheus собирает метрики каждые 15 секунд от тысяч endpoints. Grafana превращает их в дашборды, которые понимают и разработчики, и руководство.»

Prometheus — система мониторинга и алертинга с pull-моделью: он сам обходит настроенные endpoints и забирает метрики в формате text/plain. Это принципиально отличает его от push-систем (InfluxDB, Graphite): Prometheus контролирует частоту опроса, нет пропущенных данных при перегрузке агента. PromQL — мощный язык запросов для агрегации, вычисления percentile, rate() и forecast. Native Histograms (GA в 3.11) значительно снижают количество time series при высокой точности.

Grafana — платформа визуализации с поддержкой 100+ источников данных: Prometheus, Loki, Elasticsearch, PostgreSQL, Zabbix, ClickHouse и многие другие. Один дашборд может объединять данные из нескольких источников. Dynamic Dashboards в Grafana 12 строятся в 97.8 раз быстрее за счёт нового движка вычислений. Git Sync синхронизирует дашборды как код — version control, code review, откат к предыдущей версии.

В стеке IgNix Prometheus собирает метрики приложений (через exporters: node_exporter для FreeBSD/Linux, postgres_exporter, nginx_exporter, blackbox_exporter для HTTP-проверок), Grafana визуализирует их рядом с метриками из Zabbix и логами из Loki. RBAC Alerting разделяет правила алертов по командам: команда разработки видит свои сервисы, команда инфраструктуры — свои. OTLP ingestion в Prometheus 3.x позволяет принимать данные от OpenTelemetry-совместимых приложений напрямую.

Килл-фичи:

  • Pull-модель + service discovery — Prometheus сам обходит endpoints, автообнаружение через Consul/DNS/файлы

  • PromQL — язык запросов для rate(), histogram_quantile(), predict_linear() и любой агрегации метрик

  • Native Histograms (GA) — высокая точность percentile при меньшем количестве time series в storage

  • OTLP ingestion — приём данных от OpenTelemetry-совместимых сервисов без дополнительных коллекторов

  • Grafana 100+ datasources — единый UI для метрик, логов, трейсов из любых источников инфраструктуры

  • Dynamic Dashboards 97.8× — новый движок вычислений Grafana 12, real-time обновление без задержек

  • Git Sync (Grafana) — дашборды как код: версионирование, code review, автоматический деплой при merge

Что заменяет: Datadog, New Relic, Dynatrace, AppDynamics, Splunk Observability, Grafana Enterprise (платная)

Версия: Prometheus 3.11.2 / Grafana 12.4

Роль в стеке: Слой 6 — Наблюдаемость / Метрики и визуализация