Що таке Prometheus і чому його обирають для моніторингу бекенду?

Prometheus — це система моніторингу з pull-моделлю збору метрик та багатовимірною моделлю даних. Він масштабується до мільйонів метрик, підтримує service discovery та інтегрується з більшістю мов програмування. На відміну від Zabbix, Prometheus дозволяє гнучко фільтрувати та агрегувати метрики за лейблами.

Які метрики потрібно збирати для бекенду мобільного застосунку?

Критичні чотири групи: API-метрики (latency, error rate, throughput), метрики баз даних (active connections, query duration), метрики інфраструктури (CPU, RAM, disk I/O) та метрики черг (глибина, lag consumer). Особливу увагу приділяйте p95 та p99 latency — саме вони визначають UX.

Які експортери Prometheus ви підключаєте?

Ми підключаємо postgres_exporter для PostgreSQL, redis_exporter для Redis, node_exporter для метрик ОС, а також кастомні експортери для RabbitMQ/Kafka. Якщо ваш стек використовує інші технології, додамо відповідні експортери або напишемо свій.

Що робити, якщо моніторинг вже є, але не вистачає метрик?

Ми проведемо аудит поточного моніторингу, визначимо відсутні метрики та доопрацюємо конфігурацію. Часто проблема в відсутності інструментування API або невірних порогах алертів. Доповнимо дашборди та налаштуємо сповіщення у ваш месенджер.

Що таке Prometheus і чому його обирають для моніторингу бекенду?

Prometheus — це система моніторингу з pull-моделлю збору метрик та багатовимірною моделлю даних. Він масштабується до мільйонів метрик, підтримує service discovery та інтегрується з більшістю мов програмування. На відміну від Zabbix, Prometheus дозволяє гнучко фільтрувати та агрегувати метрики за лейблами.

Які метрики потрібно збирати для бекенду мобільного застосунку?

Критичні чотири групи: API-метрики (latency, error rate, throughput), метрики баз даних (active connections, query duration), метрики інфраструктури (CPU, RAM, disk I/O) та метрики черг (глибина, lag consumer). Особливу увагу приділяйте p95 та p99 latency — саме вони визначають UX.

Які експортери Prometheus ви підключаєте?

Ми підключаємо postgres_exporter для PostgreSQL, redis_exporter для Redis, node_exporter для метрик ОС, а також кастомні експортери для RabbitMQ/Kafka. Якщо ваш стек використовує інші технології, додамо відповідні експортери або напишемо свій.

Що робити, якщо моніторинг вже є, але не вистачає метрик?

Ми проведемо аудит поточного моніторингу, визначимо відсутні метрики та доопрацюємо конфігурацію. Часто проблема в відсутності інструментування API або невірних порогах алертів. Доповнимо дашборди та налаштуємо сповіщення у ваш месенджер.

Моніторинг бекенду мобільного застосунку: Prometheus + Grafana під ключ

Q: Скільки часу займає налаштування моніторингу під ключ?

Базова установка з готовими дашбордами та алертами займає 2-3 дні. Повний стек з кастомними метриками, інструментуванням коду та production-ready конфігурацією — 4-6 днів. Точний термін залежить від складності вашого бекенду.

TRUETECH займається розробкою, підтримкою та обслуговуванням мобільних додатків iOS, Android, PWA. Маємо великий досвід та експертизу для публікації мобільних додатків до популярних маркетів Google Play, App Store, Amazon, AppGallery та інші.

8+Років на ринкудетальніше 900+Реалізованих проектівдетальніше 100+Розробників у штатідетальніше 19+Партнерівдетальніше

Розробка та підтримка будь-яких видів мобільних додатків:

Інформаційні та розважальні мобільні програми

Новинки, ігри, довідники, онлайн-каталоги, погодні, фітнес та здоров'я, туристичні, освітні, соціальні мережі та месенджери, квіз, блоги та подкасти, форуми, агрегатори

Мобільні програми електронної комерції

Інтернет-магазини, B2B-додатки, маркетплейси, онлайн-обмінники, кешбек-сервіси, біржі, дропшиппінг-платформи, програми лояльності, доставка їжі та товарів, платіжні системи

Мобільні програми для управління бізнес-процесами

CRM-системи, ERP-системи, управління проектами, інструменти для команди продажів, облік фінансів, управління виробництвом, логістика та доставка, управління персоналом, системи моніторингу даних

Мобільні програми електронних послуг

Дошки оголошень, онлайн-школи, онлайн-кінотеатри, платформи надання електронних послуг, платформи кешбеку, відеохостинги, тематичні портали, платформи онлайн-бронювання та запису, платформи онлайн-торгівлі

Це лише деякі з типів мобільних додатків, з якими ми працюємо, і кожен із них може мати свої специфічні особливості та функціональність, а також бути адаптованим під конкретні потреби та цілі клієнта.

Послуги, які ми пропонуємо

Показано 1 з 1Усі 1734 послуг

Моніторинг бекенду мобільного застосунку: Prometheus + Grafana під ключ

Середній

~2-3 дні

Часті запитання

Наші компетенції:

Безкоштовна консультація

Замовте безкоштовну консультацію, якщо у вас є питання. Профільний спеціаліст вас проконсультує.

Розрахунок вартості

Якщо ви знаєте, що вам потрібно розробити, або у вас вже є готове технічне завдання.

Етапи розробки

Останні роботи

Розробка мобільного додатка для компанії FEEDME
860
Розробка мобільного додатку для компанії XOOMER
746
Розробка мобільного додатку для компанії RHL
1163
Розробка мобільного додатку для компанії ZIPPY
1035
Розробка мобільного додатку для компанії Affhome
970
Розробка мобільного додатку для компанії FLAVORS
564

Показати більше робіт

Моніторинг бекенду мобільного застосунку: Prometheus + Grafana під ключ

Уявіть: ваш мобільний застосунок раптово починає гальмувати, а Crashlytics мовчить. Користувачі йдуть, а ви не бачите причини. Це типова ситуація, коли проблема на бекенді — і без моніторингу її не знайти. Ми налаштовуємо повний стек моніторингу бекенду мобільних застосунків на базі Prometheus та Grafana, щоб ви бачили кожен збій та деградацію до того, як вони вплинуть на користувачів.

За 5+ років роботи ми провели понад 50 впроваджень для iOS та Android проєктів — від стартапів до enterprise. Гарантуємо, що через 2 дні після старту ви отримаєте робочий дашборд з ключовими метриками. Інвестиція в моніторинг окупається за 1-2 місяці: середній SLA-штраф при простої може досягати 5000 у.о. на годину, а моніторинг дозволяє скоротити час виявлення інцидентів на 80%.

Чому саме Prometheus?

Згідно з документацією Prometheus, pull-модель збору метрик спрощує виявлення нових цілей через service discovery та знижує навантаження на мережу. Prometheus масштабується до 10^6 метрик на одному інстансі, тоді як Zabbix починає гальмувати при 10^5. Багатовимірна модель даних з лейблами дозволяє гнучко фільтрувати та агрегувати — наприклад, подивитися latency лише для endpoints з методом POST.

Які метрики критичні для бекенду мобільного застосунку?

Для бекенду мобільного застосунку критичні чотири групи метрик:

Тип метрики	Приклади	Чому важливі
API-метрики	latency, error rate, throughput	p95 та p99 latency безпосередньо впливають на UX. Середнє значення приховує хвостові затримки.
Метрики БД	active connections, query duration, lock waits	Повільні запити — часта причина деградації. `pg_stat_statements` допомагає знайти їх.
Метрики інфраструктури	CPU, RAM, disk I/O	Вузькі місця на серверах призводять до падінь.
Метрики черг	глибина черги, lag consumer	Фонова обробка повинна встигати.

Додатково рекомендуємо моніторити SSL-сертифікати: термін дії закінчується — користувачі не можуть підключитися. Для цього використовуємо blackbox_exporter.

Як інструментувати API-сервер?

Prometheus очікує метрики у своєму форматі. Для різних мов — готові клієнтські бібліотеки:

# Python (FastAPI / Flask)
from prometheus_fastapi_instrumentator import Instrumentator

app = FastAPI()
Instrumentator().instrument(app).expose(app)
# Endpoint /metrics з'являється автоматично

// Go (Echo / Gin)
import "github.com/prometheus/client_golang/prometheus/promhttp"

func setupMetrics(e *echo.Echo) {
    httpRequestsTotal := prometheus.NewCounterVec(
        prometheus.CounterOpts{Name: "http_requests_total"},
        []string{"method", "path", "status"},
    )
    prometheus.MustRegister(httpRequestsTotal)

    e.Use(func(next echo.HandlerFunc) echo.HandlerFunc {
        return func(c echo.Context) error {
            err := next(c)
            httpRequestsTotal.WithLabelValues(
                c.Request().Method, c.Path(),
                strconv.Itoa(c.Response().Status),
            ).Inc()
            return err
        }
    })
    e.GET("/metrics", echo.WrapHandler(promhttp.Handler()))
}

Важно: не створюйте метрику з path як high-cardinality label — якщо в path є user_id або інші динамічні значення, Prometheus захлинеться. Нормалізуйте шлях: /users/12345/profile → /users/:id/profile. Також налаштовуємо кастомні метрики для бізнес-логіки: кількість замовлень, помилки аутентифікації, час відповіді зовнішніх API.

Яка конфігурація Prometheus підходить для production?

Базовий prometheus.yml для мобільного бекенду:

global:
  scrape_interval: 15s
  evaluation_interval: 15s

scrape_configs:
  - job_name: 'api-server'
    static_configs:
      - targets: ['api:8080']
    metrics_path: /metrics

  - job_name: 'postgres'
    static_configs:
      - targets: ['postgres-exporter:9187']

  - job_name: 'redis'
    static_configs:
      - targets: ['redis-exporter:9121']

  - job_name: 'node'
    static_configs:
      - targets: ['node-exporter:9100']

Для production — Service Discovery через Consul або Kubernetes service discovery замість static_configs. Також додаємо scrape_timeout по 10s, щоб не чекати завислі ендпоінти.

Як ми це робимо: кейс з практики

Один наш клієнт з мобільним застосунком для доставки зіткнувся з ростом p99 latency до 12 секунд. Після впровадження моніторингу виявили вузьке місце в запиті до PostgreSQL — був відсутній індекс. Оптимізація зайняла 2 години, а latency впала до 200ms (покращення в 60 разів). Без моніторингу ця проблема могла залишатися непоміченою тижнями, а втрати від пішлих користувачів склали б десятки тисяч у.о.

Які дашборди будуємо в Grafana?

Не потрібно будувати дашборди з нуля — Grafana.com/dashboards містить готові: ID 1860 для Node Exporter, ID 9628 для PostgreSQL через postgres_exporter. Імпортуються одним кліком.

Для API-моніторингу будуємо кастомний дашборд з ключовими панелями:

rate(http_requests_total[5m]) — RPS по endpoint
histogram_quantile(0.95, rate(http_request_duration_seconds_bucket[5m])) — p95 latency
rate(http_requests_total{status=~"5.."}[5m]) / rate(http_requests_total[5m]) — error rate

Панель	Метрика	Джерело	Важливість
RPS	`rate(http_requests_total[5m])`	API	Висока — показує навантаження
p95 latency	`histogram_quantile(0.95, ...)`	API	Критична — впливає на UX
Error rate	`... / rate(...)`	API	Висока
Active connections	`pg_stat_activity_count`	postgres_exporter	Середня
Queue lag	`redis_queue_length`	redis_exporter	Середня

Як налаштувати алертинг?

Grafana Alerting або Alertmanager — налаштовуємо пороги для PagerDuty/Telegram/Slack. Мінімальний набір алертів для мобільного бекенду:

# alerting/rules.yml
groups:
  - name: api
    rules:
      - alert: HighErrorRate
        expr: rate(http_requests_total{status=~"5.."}[5m]) / rate(http_requests_total[5m]) > 0.05
        for: 2m
        labels:
          severity: critical
        annotations:
          summary: "Error rate > 5% on {{ $labels.job }}"

      - alert: HighLatency
        expr: histogram_quantile(0.95, rate(http_request_duration_seconds_bucket[5m])) > 1
        for: 5m
        annotations:
          summary: "p95 latency > 1s"

for: 2m — не піднімати алерт при короткочасних сплесках, тільки при стійкій деградації. Покрокова інструкція:

Встановити Alertmanager та налаштувати receivers (Telegram, Slack).
Створити файл rules.yml з описаними правилами.
Додати файл в prometheus.yml секцію rule_files.
Перевірити правила через promtool check rules rules.yml.
Налаштувати маршрутизацію: critical алерти — в Telegram/PagerDuty, warning — в Slack.

Типові помилки при налаштуванні моніторингу

Висока кардинальність лейблів — не включайте в path user_id або session_id.
Відсутність порогів для алертів — без них ви дізнаєтеся про проблему тільки від користувачів.
Ігнорування p99 latency — середнє значення приховує поодинокі уповільнення.
Неправильний scrape_interval — надто рідкісний збір пропустить короткочасні сплески.

Що входить в нашу роботу

Docker Compose або Kubernetes манифести для Prometheus, Grafana, Alertmanager
Інструментування API-сервера (Python / Go / Node.js / Java)
Підключення експортерів: postgres_exporter, redis_exporter, node_exporter
Кастомні дашборди в Grafana під специфіку застосунку
Налаштування алертів з маршрутизацією в Telegram / Slack / PagerDuty
Документація по метриках і порогах алертів

Терміни та вартість

Базова установка з готовими дашбордами та алертами: 2–3 дні. Повний стек з кастомними метриками, інструментуванням коду та production-ready конфігурацією: 4–6 днів. Вартість розраховується індивідуально. Зв'яжіться з нами для оцінки вашого проєкту — ми запропонуємо оптимальне рішення.

Замовте налаштування моніторингу — оцінимо ваш проєкт за 1 день. Отримайте консультацію щодо вибору метрик та порогів алертів.

Аналітика мобільних застосунків: Firebase, Amplitude, AppsFlyer та атрибуція

Наша команда регулярно стикається з проектами, де аналітика вже «налаштована», але реальних інсайтів немає. Типовий приклад — стартап з 50k DAU: трекінг десятків подій без жодної відповіді на питання «чому користувачі не доходять до оплати». За два тижні ми побудували базову воронку і з'ясували, що 70% аудиторії відвалюється на екрані верифікації номера телефону. Після локалізації бага retention зріс на 12%. Висновок: аналітика повинна починатися з конкретних питань, а не з трекінгу всього підряд.

Чому таксономія подій — основа аналітики мобільних застосунків?

Firebase Analytics, Amplitude, Mixpanel — технічно схожі. Різниця в тому, що ви в них кладете. Типова помилка: події screen_view, button_tap_1, button_tap_2 без контексту. Через місяць ніхто не пам'ятає, що таке button_tap_2.

Правильна таксономія: об'єкт + дія + контекст. product_viewed, checkout_started, payment_completed з параметрами product_id, category, price, source. Це дозволяє будувати воронки, когортний аналіз та retention без додаткового трекінгу.

Ми фіксуємо naming convention у tracking plan — документі (Google Sheet або Amplitude Data Catalog), де описано кожну подію, її параметри та умови спрацьовування. Tracking plan синхронізується з командою аналітиків до початку розробки, а не після. Такий підхід гарантує, що через місяць дані залишаться інтерпретованими, а не перетворяться на звалище. Досвід впровадження на 50+ проектах підтверджує: при відсутності tracking plan вартість підтримки аналітики зростає у 2-3 рази за рахунок переробок.

Що обрати для аналітики мобільних застосунків: Firebase, Amplitude чи Mixpanel?

Таблиця нижче показує ключові відмінності трьох популярних платформ. Вибір залежить від бюджету, трафіку та завдань.

Критерій	Firebase Analytics	Amplitude	Mixpanel
Безкоштовний ліміт	Безліміт (в рамках Spark-плану)	До 10 млн events/міс	До 1 тис. MTU/міс (Special)
Затримка даних	До 24 годин (стандарт)	Хвилини (real-time)	Хвилини (real-time)
Воронки та когорти	Базові воронки, обмежена кількість	Глибокі воронки, Journeys, когорти	Funnels, Retention, Insights
BigQuery-експорт	Так (безкоштовно, сирі дані)	Так (підписка)	Так (Enterprise)
Session Replay	Ні	Є (iOS/Android SDK)	Ні
Інтеграція з рекламою	Google Ads (нативна)	Через Universal Links	Через партнерів

Firebase Analytics — безкоштовно, глибока інтеграція з Google Ads, BigQuery-експорт для сирих даних. Обмеження: затримка даних до 24 годин, обмежені воронки. Для стартапів з Google Ads трафіком — перший вибір.

Amplitude — продуктова аналітика з акцентом на когорти та шляхи користувача. Journeys (колишній Pathfinder) показує реальні шляхи між подіями — не передбачувані воронки, а фактичні маршрути. Session Replay — запис сесій для UX-аналізу. Безкоштовний тир до 10 млн events/місяць достатній для більшості продуктів на старті.

Mixpanel — ближче до Amplitude, сильніший у сегментації в реальному часі. Insights, Funnels, Retention — базові інструменти, які закривають 90% аналітичних завдань продакта.

Більш формальні визначення цих платформ можна знайти у Wikipedia (Firebase) та Wikipedia (Amplitude).

Як вирішити проблему мультиканальної атрибуції з AppsFlyer?

Знати звідки прийшов користувач — окреме завдання. Firebase Attribution працює лише всередині Google-екосистеми. Для мультиканальної атрибуції (Facebook Ads, TikTok, Apple Search Ads, programmatic) потрібен MMP — Mobile Measurement Partner.

AppsFlyer — лідер ринку. OneLink — universal deep link, який працює на iOS та Android і коректно атрибутує встановлення з будь-якого каналу. Protect360 — вбудований захист від fraud (фейкові встановлення, click injection на Android). Adjust та Branch — конкуренти з подібним функціоналом. Branch сильний у deep linking; Adjust популярний у gaming.

Згідно з Apple, з iOS 14.5 застосунки повинні отримувати дозвіл користувача через ATT перед збором IDFA для відстеження. AppsFlyer використовує probabilistic matching (IP + user agent + timing) для цих користувачів — точність нижча, але краще ніж нічого. SKAdNetwork та Privacy Preserving Attribution надають агреговані дані від Apple із затримкою 24-72 години.

Як налаштувати crash-аналітику, щоб не пропускати баги?

Firebase Crashlytics — стандарт для crash reporting. Автоматично групує креші за стектрейсом, показує affected users %, velocity alerts при зростанні crash rate більш ніж на 10% за годину.

Важливо: символікація. На iOS .dSYM файли повинні автоматично завантажуватися при кожній збірці — через Fastlane upload_symbols_to_crashlytics або Xcode Cloud built-in. Без символів креш у Crashlytics виглядає як набір адрес пам'яті. Це трапляється частіше, ніж здається при переході на новий CI — в одному проекті з аудиторією 500k користувачів ми виявили, що 40% крешів залишалися несимволізованими через пропущений етап у CI/CD. Після автоматизації час реакції на баги скоротився з 3 годин до 15 хвилин.

Для React Native та Flutter — @sentry/react-native та sentry_flutter дають додатковий контекст: breadcrumbs, мережеві запити перед крешем, стан Redux/Provider.

Нижче — порівняння популярних інструментів crash-аналітики для вибору під свої завдання.

Критерій	Firebase Crashlytics	Sentry	Instabug
Безкоштовний ліміт	Безліміт (в рамках Spark)	5k events/міс	250 MAU
Групування	За стектрейсом + параметри	За fingerprint	За стектрейсом + метадані
Символікація	Автоматична (через файл)	Автоматична (через CLI)	Автоматична
Velocity alerts	Так (за % зміни)	Так (за кількістю)	Так (за порогом)
Дод. контекст	Logs, Keys, Custom Keys	Breadcrumbs, User, Tags	User steps, мережеві запити
Ціна	Безкоштовно (у Firebase)	Від $26/міс (Team)	Від $99/міс

Налаштування оточення

Три оточення з окремими Firebase проектами: dev, staging, production. Змішувати аналітику з тестових сесій і production — поширена помилка, яка спотворює всі метрики. На iOS через GoogleService-Info.plist для кожної схеми, на Android через google-services.json у папці кожного flavor.

Терміни: базова аналітика з Firebase + Crashlytics — 3-5 днів. Повноцінний tracking plan + Amplitude/Mixpanel з воронками та когортами — 2-3 тижні. Атрибуція через AppsFlyer з deep linking та fraud protection — 1-2 тижні. Вартість розраховується індивідуально залежно від складності інтеграцій.

Що входить у нашу роботу

В рамках впровадження аналітики ми надаємо:

Розробку та узгодження tracking plan з командами продукту та маркетингу.
Інтеграцію SDK (Firebase, Amplitude, Mixpanel, AppsFlyer) з урахуванням вашого стеку (Swift/Kotlin/Flutter/React Native).
Налаштування воронок, когорт, дашбордів та алертів.
Автоматизацію символікації та завантаження .dSYM через Fastlane.
Документацію щодо подій та параметрів.
Навчання команди роботі з аналітичною платформою.
Два тижні пост-релізної підтримки та коригування трекінгу.

Наш досвід — 7 років впровадження аналітики та понад 80 успішних проектів у сфері мобільної розробки. Ми гарантуємо коректність даних і прозорість кожного етапу.

Зв'яжіться з нами, щоб отримати консультацію з налаштування аналітики вашого застосунку. Замовте аудит поточної аналітики — і ми покажемо, які метрики ви втрачаєте.