Які метрики варто кастомізувати в першу чергу?

В першу чергу варто кастомізувати бізнес-метрики: кількість замовлень, конверсію, активних користувачів. А також технічні метрики додатку: розмір черги, cache hit rate, час відповіді. Це дає швидку віддачу.

Чим Prometheus відрізняється від CloudWatch?

Prometheus дозволяє збирати метрики з частотою до 10 мс, зберігає їх локально та повністю безкоштовний (крім хостингу). CloudWatch інтегрований з AWS, має зберігання до 15 місяців, але коштує грошей за кожну метрику. Вибір залежить від оточення та бюджету.

Як часто потрібно оновлювати recording rules?

Recording rules оновлюються за розкладом Prometheus (зазвичай кожні 30 секунд). Ми рекомендуємо переглядати їх раз на квартал, коли змінюються бізнес-вимоги або з'являються нові метрики.

Чи потрібен окремий сервер для Prometheus?

Так, Prometheus вимагає окремого сервера (або інстанса). Ви можете використовувати Kubernetes, віртуальну машину або безсерверний варіант через Cortex/Thanatos. Мінімальні вимоги: 2 CPU, 4 GB RAM для середнього проекту.

Скільки коштують CloudWatch метрики?

Вартість CloudWatch метрик залежить від кількості та частоти відправки. В середньому $0.30 за метрику на місяць. Ми допомагаємо оптимізувати витрати, використовуючи релевантні метрики та фільтрацію.

Які метрики варто кастомізувати в першу чергу?

В першу чергу варто кастомізувати бізнес-метрики: кількість замовлень, конверсію, активних користувачів. А також технічні метрики додатку: розмір черги, cache hit rate, час відповіді. Це дає швидку віддачу.

Чим Prometheus відрізняється від CloudWatch?

Prometheus дозволяє збирати метрики з частотою до 10 мс, зберігає їх локально та повністю безкоштовний (крім хостингу). CloudWatch інтегрований з AWS, має зберігання до 15 місяців, але коштує грошей за кожну метрику. Вибір залежить від оточення та бюджету.

Як часто потрібно оновлювати recording rules?

Recording rules оновлюються за розкладом Prometheus (зазвичай кожні 30 секунд). Ми рекомендуємо переглядати їх раз на квартал, коли змінюються бізнес-вимоги або з'являються нові метрики.

Чи потрібен окремий сервер для Prometheus?

Так, Prometheus вимагає окремого сервера (або інстанса). Ви можете використовувати Kubernetes, віртуальну машину або безсерверний варіант через Cortex/Thanatos. Мінімальні вимоги: 2 CPU, 4 GB RAM для середнього проекту.

Скільки коштують CloudWatch метрики?

Вартість CloudWatch метрик залежить від кількості та частоти відправки. В середньому $0.30 за метрику на місяць. Ми допомагаємо оптимізувати витрати, використовуючи релевантні метрики та фільтрацію.

Налаштування кастомних метрик та алертів (Prometheus / CloudWatch)

Наша компанія займається розробкою, підтримкою та обслуговуванням сайтів будь-якої складності. Від простих односторінкових сайтів до масштабних кластерних систем, побудованих на мікро сервісах. Досвід розробників підтверджено сертифікатами від вендорів.

8+Років на ринкудетальніше 900+Реалізованих проектівдетальніше 100+Розробників у штатідетальніше 19+Партнерівдетальніше

Розробка та обслуговування будь-яких видів сайтів:

Інформаційні сайти або веб-програми

Сайти візитки, landing page, корпоративні сайти, онлайн каталоги, квіз, промо-сайти, блоги, ресурси новин, інформаційні портали, форуми, агрегатори

Сайти або веб-програми електронної комерції

Інтернет-магазини, B2B-портали, маркетплейси, онлайн-обмінники, кешбек-сайти, біржі, дропшиппінг-платформи, парсери товарів

Веб-програми для управління бізнес-процесами

CRM-системи, ERP-системи, корпоративні портали, системи управління виробництвом, парсери інформації

Сайти або веб-програми електронних послуг

Дошки оголошень, онлайн-школи, онлайн-кінотеатри, конструктори сайтів, портали надання електронних послуг, відеохостинги, тематичні портали

Це лише деякі з технічних типів сайтів, з якими ми працюємо, і кожен із них може мати свої специфічні особливості та функціональність, а також бути адаптованим під конкретні потреби та цілі клієнта.

Послуги, які ми пропонуємо

Показано 1 з 1Усі 2062 послуг

Налаштування кастомних метрик та алертів (Prometheus / CloudWatch)

Середній

~2-3 дні

Часті запитання

Наші компетенції:

Безкоштовна консультація

Замовте безкоштовну консультацію, якщо у вас є питання. Профільний спеціаліст вас проконсультує.

Розрахунок вартості

Якщо ви знаєте, що вам потрібно розробити, або у вас вже є готове технічне завдання.

Етапи розробки

Останні роботи

Розробка сайту компанії B2B ADVANCE
1360
Розробка веб-додатків для компанії FEEDME
1251
Розробка веб-сайту для компанії БЕЛФІНГРУП
957
Розробка інтернет магазину для компанії FURNORO
1188
Розробка веб-додатків для компанії Enviok
929
Розробка веб-сайту для компанії ФІКСПЕР
947

Показати більше робіт

Уявіть: ваш інтернет-магазин втрачає замовлення, але метрики CPU та пам'яті в нормі. Де шукати проблему? Ми зіткнулися з таким кейсом: клієнт скаржився на повільне завантаження сторінки кошика. Після впровадження кастомних метрик ми виявили, що час відповіді від платіжного шлюзу перевищував 5 секунд при навантаженні. Стандартні метрики цього не показували. Кастомні метрики — єдиний спосіб побачити реальну поведінку додатку. Без них ви сліпі: інцидент може коштувати до 10% виручки за годину простою. У цій статті розберемо, які метрики варто кастомізувати, як їх налаштувати в Prometheus та CloudWatch, і скільки часу займає інтеграція. Понад 5 років досвіду в моніторингу та 50+ проектів підтверджують: кастомні метрики економлять мільйони на інцидентах.

Які метрики кастомізувати в першу чергу?

Бізнес-метрики: кількість створених замовлень на хвилину, конверсія checkout воронки, активні користувацькі сесії. Технічні метрики: розмір черги обробки задач, cache hit rate, час виконання конкретних операцій, кількість помилок за типом. Зовнішні залежності: latency до сторонніх API, доступність платіжного шлюзу, статус інтеграцій. Наприклад, конверсія впала з 3% до 1% — метрику conversion_rate ми б відстежували і били тривогу. Для швидкого виявлення проблем ми також моніторимо 99-й перцентиль часу відповіді та кількість помилок бази даних (N+1 query).

Як налаштувати кастомні метрики в Prometheus?

Для інструментування Python (FastAPI) використовуємо бібліотеку prometheus_client:

from prometheus_client import Counter, Histogram, Gauge
from prometheus_fastapi_instrumentator import Instrumentator

# Лічильник
order_counter = Counter(
    'orders_created_total',
    'Total orders created',
    ['status', 'payment_method']
)

# Гістограма (для percentile)
checkout_duration = Histogram(
    'checkout_duration_seconds',
    'Time spent in checkout process',
    buckets=[0.1, 0.5, 1.0, 2.0, 5.0, 10.0]
)

# Gauge (поточне значення)
queue_size = Gauge(
    'task_queue_size',
    'Current size of processing queue'
)

# Використання в коді
async def create_order(order_data: dict):
    with checkout_duration.time():
        result = await process_order(order_data)
    
    order_counter.labels(
        status=result.status,
        payment_method=order_data['payment_method']
    ).inc()
    
    return result

Node.js (prom-client):

const client = require('prom-client')

const httpDuration = new client.Histogram({
  name: 'http_request_duration_ms',
  help: 'Duration of HTTP requests in ms',
  labelNames: ['method', 'route', 'code'],
  buckets: [1, 5, 15, 50, 100, 200, 500, 1000, 2000]
})

app.use((req, res, next) => {
  const end = httpDuration.startTimer()
  res.on('finish', () => {
    end({ method: req.method, route: req.route?.path, code: res.statusCode })
  })
  next()
})

Після додавання метрик не забудьте експортувати їх через /metrics endpoint та налаштувати збір у prometheus.yml.

Що обрати: Prometheus чи CloudWatch?

Критерій	Prometheus	CloudWatch
Частота збору	до 10 мс	1 хвилина (мінімум)
Зберігання	локально (до 15 днів)	до 15 місяців
Складність налаштування	вища (потрібен свій сервер)	нижча (вбудований в AWS)
Вартість	безкоштовно (свій хостинг)	плата за метрики
Гнучкість алертів	висока (Alertmanager)	середня (SNS)

Prometheus дозволяє збирати метрики з частотою до 10 мс, що в 20 разів швидше, ніж CloudWatch. Однак CloudWatch зручніший для AWS-оточень. Для детального вивчення зверніться до документації Prometheus та CloudWatch.

Prometheus Rules: Recording та Alerting

Для швидких дашбордів та своєчасних сповіщень ми налаштовуємо recording та alerting rules. Recording rules попередньо обчислюють складні вирази (наприклад, job:request_errors:rate5m), що прискорює запити в Grafana. Alerting rules запускають сповіщення при перевищенні порогів. Приклад конфігурації:

groups:
  - name: app_slo
    interval: 30s
    rules:
      # Recording rule: попередньо обчислена метрика помилок
      - record: job:request_errors:rate5m
        expr: rate(http_requests_total{status=~"5.."}[5m])
      
      # Alert: висока кількість помилок
      - alert: HighErrorRate
        expr: job:request_errors:rate5m > 0.05
        for: 2m
        labels:
          severity: critical
        annotations:
          summary: "Error rate {{ $value | humanizePercentage }}"

Alertmanager потім надсилає оповіщення в Slack, Telegram або PagerDuty. Це дозволяє реагувати за хвилини, а не години.

Як налаштувати CloudWatch Custom Metrics?

import boto3

cw = boto3.client('cloudwatch')

def put_metric(name: str, value: float, unit: str = 'Count', dimensions: dict = None):
    metric_data = {
        'MetricName': name,
        'Value': value,
        'Unit': unit
    }
    
    if dimensions:
        metric_data['Dimensions'] = [
            {'Name': k, 'Value': v} for k, v in dimensions.items()
        ]
    
    cw.put_metric_data(
        Namespace='MyApp/Business',
        MetricData=[metric_data]
    )

# Використання
put_metric('OrdersCreated', 1, 'Count', {'Environment': 'production'})
put_metric('CheckoutDuration', 0.85, 'Seconds', {'PaymentMethod': 'card'})
put_metric('QueueDepth', queue.size(), 'Count')

CloudWatch Alarm на кастомній метриці:

resource "aws_cloudwatch_metric_alarm" "queue_depth" {
  alarm_name          = "high-queue-depth"
  comparison_operator = "GreaterThanThreshold"
  evaluation_periods  = 3
  metric_name         = "QueueDepth"
  namespace           = "MyApp/Business"
  period              = 60
  statistic           = "Maximum"
  threshold           = 1000
  alarm_description   = "Task queue is backed up"
  
  dimensions = {
    Environment = "production"
  }
  
  alarm_actions = [aws_sns_topic.alerts.arn]
  ok_actions    = [aws_sns_topic.alerts.arn]
}

Що входить в роботу?

Етап	Результат
Аудит поточних метрик	Звіт з рекомендаціями та економічними оцінками
Вибір інструменту	Prometheus або CloudWatch з обґрунтуванням
Інструментування коду	Вихідний код метрик (Python, Node.js, Go, Java)
Налаштування алертів	Alertmanager/SNS + канали сповіщення (Slack, Telegram, email)
Тестування	Навантажувальні тести, верифікація метрик, перевірка алертів
Документація та навчання	Runbook, дашборди (Grafana / CloudWatch Dashboard), доступи

Як ми налаштовуємо моніторинг за 3-7 днів?

Ми проходимо етапи: аудит поточних метрик, вибір інструменту, написання коду метрик, налаштування алертів, тестування, документація та навчання команди. На виході ви отримуєте дашборди Grafana (або CloudWatch Dashboard), оповіщення в Slack/Telegram/email та повну документацію. Гарантуємо SLA 99.9% на коректну роботу метрик. При необхідності інтегруємо з існуючими системами (PagerDuty, Opsgenie).

Покрокова інструкція: як додати першу кастомну метрику

Встановіть бібліотеку prometheus_client (Python) або prom-client (Node.js).
Створіть метрику потрібного типу (Counter, Histogram, Gauge).
Інструментуйте код: додайте виклики метрики в ключові точки.
Експортуйте метрики (наприклад, через /metrics endpoint).
Налаштуйте збір метрик в Prometheus (додайте job у prometheus.yml).

Чек-лист: що потрібно для налаштування

Встановлений Prometheus або доступ до AWS CloudWatch
Бібліотеки для інструментування
Доступ до коду додатку
Налаштований Alertmanager або SNS топік

Чому кастомні метрики економлять бюджет?

Стандартні метрики (CPU, RAM) не показують бізнес-показники. Без кастомних метрик ви витрачаєте години на пошук неіснуючих проблем. Один інцидент, виявлений із запізненням на годину, може коштувати більше, ніж рік обслуговування моніторингу. Кастомні метрики дозволяють скоротити середній час виявлення (MTTD) з годин до хвилин, а отже, знизити фінансові втрати.

Замовте налаштування кастомних метрик — отримайте повний контроль над продуктивністю та бізнес-показниками вашого додатку. Зв'яжіться з нами для безкоштовної консультації — ми оцінимо ваш проект за 1 день. Понад 50 проектів з моніторингу та 5+ років досвіду гарантують результат.

Ми регулярно стикаємося з ситуацією: «Сайт не відкривається» о 3 годині ночі — і виявляється, що disk full на VPS, тому що логи nginx не ротувалися півроку. Або сервер ліг під навантаженням у день запуску рекламної кампанії, тому що на shared хостингу стояв ліміт у 50 одночасних з'єднань. Налаштування хостингу та деплою — це не про «де дешевше», це про те, що відбувається в момент, коли щось іде не так. Наша команда допомагає уникнути таких інцидентів, проектуючи інфраструктуру з урахуванням реальних патернів навантаження.

Коли обирати Vercel та Netlify?

Vercel створений під Next.js — деплой в один push, preview deployments для кожного PR, автоматичний CDN, Edge Functions, ISR без конфігурації. Для фронтенд-проєктів та JAMstack це оптимальний вибір: немає операційного навантаження, time-to-deploy вимірюється хвилинами.

Обмеження реальні: Vercel Serverless Functions запускаються в us-east-1 за замовчуванням (latency для Європи +80–100ms), Function timeout 300 секунд на Pro, Bandwidth 1TB/місяць на Pro. Для важкого backend — потрібні воркери або окремий сервер.

Netlify ближчий до статики та Edge Functions на базі Deno Deploy. Build minutes — основне обмеження на безкоштовному тарифі.

Критерій	Vercel	Netlify
Основна спеціалізація	Next.js, фреймворки	Статика, JAMstack
Edge Functions	V8 isolates (Node.js)	Deno Deploy
Preview Deployments	Вбудовані	Вбудовані
Serverless Functions	Так, обмеження 300s	Так, обмеження 10s
Безкоштовний ліміт bandwidth	100 GB	100 GB

Чому Docker — основа передбачуваного деплою?

«Працює на моїй машині» — класика. Docker вирішує це через контейнеризацію середовища. Але поганий Dockerfile створює нові проблеми.

Типова помилка: копіювати все в образ без .dockerignore, отримувати 800MB образ замість 80MB. node_modules всередині образу важить стільки ж. Правильно: multi-stage build.

FROM node:20-alpine AS builder
WORKDIR /app
COPY package*.json ./
RUN npm ci --only=production
COPY . .
RUN npm run build

FROM node:20-alpine AS runner
WORKDIR /app
COPY --from=builder /app/.next ./.next
COPY --from=builder /app/node_modules ./node_modules
COPY --from=builder /app/package.json ./package.json
EXPOSE 3000
CMD ["npm", "start"]

Підсумковий образ: 180MB замість 1.2GB. Час збірки CI скорочується через layer caching — якщо package.json не змінився, шар з npm ci береться з кешу.

Docker Compose для локальної розробки та простих продакшн-сценаріїв: застосунок + PostgreSQL + Redis в одній конфігурації. Для production на одному сервері — цілком робочий варіант, якщо немає вимог горизонтального масштабування.

Детальніше про контейнеризацію — Wikipedia: Docker.

Як налаштувати Nginx як reverse proxy?

Nginx перед застосунком — стандарт для VPS та виділених серверів. Основні функції: SSL termination, gzip, static files, rate limiting, upstream балансування.

Конфігурація, яку часто роблять неправильно: worker_processes auto — кількість процесів дорівнює числу CPU. worker_connections 1024 — це 1024 на кожний воркер-процес. При 4 CPU та 1024 connections = 4096 одночасних з'єднань. Для високонавантаженого сайту потрібно worker_connections 4096 та налаштування keepalive_timeout 65.

Для статичних ассетів з хешем в імені файлу:

location ~* \.(js|css|woff2|png|webp)$ {
    expires 1y;
    add_header Cache-Control "public, immutable";
}

immutable повідомляє браузеру: не перевіряй цей файл навіть при hard refresh. Правильно працює лише з content-hashed іменами файлів (що робить Vite/webpack за замовчуванням). Документація — Wikipedia: Nginx.

AWS: гнучкість та складність

EC2 + Auto Scaling Group — класика для горизонтального масштабування. AMI з попередньо встановленим застосунком, Launch Template, ASG з min/desired/max instances, Application Load Balancer. При CPU > 70% на 3 хвилини — scale out, при CPU < 30% на 15 хвилин — scale in. Health check через ALB виключає нездорові інстанси з ротації.

ECS Fargate — контейнери без управління EC2. Деплой Docker-образу, задаєте CPU/пам'ять (512 CPU units = 0.5 vCPU, від 512MB пам'яті), Fargate запускає. Дорожче Lambda, але немає cold start та немає timeout-обмежень. Підходить для long-running процесів, WebSocket-серверів, важких воркерів.

RDS для PostgreSQL з Multi-AZ: автоматичний failover за 1–2 хвилини при падінні primary. Read Replicas для масштабування читання. RDS Proxy для connection pooling — Lambda-функції не вміють тримати довгострокові з'єднання, проксі буферизує це.

Kubernetes: коли це виправдано

K8s додає значну операційну складність. Виправданий, коли: кілька команд деплоять незалежні сервіси, потрібне тонке налаштування ресурсів на сервіс, canary deployments та blue/green без простою — вимога.

AWS EKS, GKE або managed k8s від Hetzner (дешевше). Helm charts для стандартних сервісів. Horizontal Pod Autoscaler по CPU та custom metrics (RPS через Prometheus).

Для більшості стартапів та середніх проєктів — Kubernetes надмірний. ECS або Fly.io дають 80% можливостей при 20% операційної складності.

Моніторинг та alerting

Сервер без моніторингу — це очікування інциденту. Мінімальний стек: Prometheus + Grafana (або Grafana Cloud для managed), alerting на disk > 80%, memory > 85%, CPU > 90% за 5 хвилин, error rate > 1%. Uptime через Better Uptime або Upptime (self-hosted).

Logs: Loki + Grafana або CloudWatch Logs Insights. Структуровані JSON-логи (winston, pino) — обов'язково, інакше пошук по логах перетворюється на біль.

Що входить у налаштування хостингу

Аудит поточної інфраструктури та профілювання навантаження
Вибір цільової архітектури (VPS, AWS, serverless, Kubernetes)
Налаштування CI/CD pipeline (GitHub Actions, GitLab CI) з автоматичним деплоєм
IaC через Terraform або Pulumi (інфраструктура як код)
Конфігурація Nginx, SSL-сертифікати, HTTP/2, brotli
Моніторинг та алертинг (Prometheus + Grafana, PagerDuty)
Документація runbooks та навчання команди

Додатково: пишіть, якщо потрібна міграція з поточного хостингу або інтеграція із зовнішніми сервісами.

Процес роботи

Аудит поточної інфраструктури (2–5 днів)
Вибір цільової архітектури з обґрунтуванням за навантаженням та бюджетом (1–3 дні)
Налаштування CI/CD pipeline (GitHub Actions, GitLab CI) (2–5 днів)
IaC через Terraform або Pulumi (3–10 днів)
Налаштування моніторингу та alerting (2–5 днів)
Документація runbooks та навчання команди (1–3 дні)

Наш досвід — 7 років на ринку, понад 50 проєктів, гарантія працездатності після деплою.

Терміни

Базовий деплой на VPS з Docker + Nginx + CI/CD: 1–2 тижні.
Налаштування AWS інфраструктури з Auto Scaling, RDS, CDN: 3–6 тижнів.
Міграція на EKS з нуля: 6–12 тижнів.
Налаштування Vercel/Netlify для JAMstack: 3–5 днів.

Вартість розраховується індивідуально залежно від складності та обсягу робіт. Отримайте консультацію — оцінимо вашу архітектуру за один день.