Як часто потрібно перевіряти відставання ноди?

Для EVM-мереж достатньо перевіряти кожні 15-30 секунд, для Solana (швидкі слоти) — кожні 10 секунд. Важливо використовувати окремий референсний RPC для порівняння.

Що таке auto-failover для RPC?

Це автоматичне перемикання трафіку на резервну ноду при відмові основної. Health-check включає не лише HTTP-статус, але й актуальність даних (block lag). Реалізується через HAProxy або nginx із зовнішнім скриптом перевірки.

Як захистити валідатора від слешінгу?

Моніторинг пропущених блоків та атестацій у реальному часі. При перевищенні порогу (наприклад >5% за 5 хвилин) надсилається критичний алерт. Додатково — автоматичний перезапуск служби валідатора при зависанні.

Скільки часу займає розробка системи моніторингу?

Базова система для 3-5 мереж з дашбордами та алертами — 3-4 тижні. Розширена з auto-failover та кастомними експортерами — 6-8 тижнів. Терміни уточнюються індивідуально.

Як часто потрібно перевіряти відставання ноди?

Для EVM-мереж достатньо перевіряти кожні 15-30 секунд, для Solana (швидкі слоти) — кожні 10 секунд. Важливо використовувати окремий референсний RPC для порівняння.

Що таке auto-failover для RPC?

Це автоматичне перемикання трафіку на резервну ноду при відмові основної. Health-check включає не лише HTTP-статус, але й актуальність даних (block lag). Реалізується через HAProxy або nginx із зовнішнім скриптом перевірки.

Як захистити валідатора від слешінгу?

Моніторинг пропущених блоків та атестацій у реальному часі. При перевищенні порогу (наприклад >5% за 5 хвилин) надсилається критичний алерт. Додатково — автоматичний перезапуск служби валідатора при зависанні.

Скільки часу займає розробка системи моніторингу?

Базова система для 3-5 мереж з дашбордами та алертами — 3-4 тижні. Розширена з auto-failover та кастомними експортерами — 6-8 тижнів. Терміни уточнюються індивідуально.

Розробка системи моніторингу безлічі блокчейн-нод

Q: Які метрики блокчейн-нод критичні?

Найважливіші: відставання по блоках (block lag), кількість пірів, статус синхронізації, заповненість mempool, а для валідаторів — пропущені блоки та баланс. Ці метрики напряму впливають на коректність даних і ризик слешінгу.

Проєктуємо та розробляємо блокчейн-рішення повного циклу: від архітектури смарт-контрактів до запуску DeFi-протоколів, NFT-маркетплейсів та криптобірж. Аудит безпеки, токеноміка, інтеграція з наявною інфраструктурою.

8+Років на ринкудетальніше 900+Реалізованих проектівдетальніше 100+Розробників у штатідетальніше 19+Партнерівдетальніше

Послуги, які ми пропонуємо

Показано 1 з 1Усі 1305 послуг

Розробка системи моніторингу безлічі блокчейн-нод

Середній

~1-2 тижні

Часті запитання

Напрямки блокчейн-розробки

Обговорити блокчейн-проєкт

Безкоштовна консультація — розповімо, як блокчейн вирішить вашу задачу

Оцінити вартість

Розрахуємо бюджет та терміни вашого блокчейн-проєкту

Етапи блокчейн-розробки

Останні роботи

Розробка сайту компанії B2B ADVANCE
1357
Розробка веб-додатків для компанії FEEDME
1250
Розробка веб-сайту для компанії БЕЛФІНГРУП
955
Розробка інтернет магазину для компанії FURNORO
1188
Розробка логотипу компанії B2B Advance
646
Розробка веб-додатків для компанії Enviok
926

Показати більше робіт

Моніторинг блокчейн-нод — це не «поставити Prometheus і заспокоїтися». Blockchain-специфічні метрики принципово відрізняються від стандартних серверних: нода може бути повністю живою з точки зору процесу, але відстати на 10000 блоків від чейну і тихо віддавати застарілі дані клієнтам. Стандартний uptime-монітор цього не побачить. Розробка системи моніторингу безлічі блокчейн-нод вимагає врахування особливостей кожної мережі: EVM, Solana, Cosmos — у кожної своя телеметрія та критичні метрики. Без спеціалізованої системи ви ризикуєте втратити стейкінг через пропущені атестації або завдати шкоди користувачам RPC-сервісу застарілими даними. Наша команда має 10+ років досвіду в блокчейн-розробці та понад 50 реалізованих проєктів моніторингу. Середня економія від впровадження — від 5000$ на місяць на 10 нод. Замовте розробку системи моніторингу, щоб убезпечити свої ноди від слешінгу та простоїв.

Наша система моніторингу в 3 рази ефективніша за стандартні рішення: завдяки кастомним експортерам та auto-remediation ми виявляємо проблеми на ранніх стадіях, що дозволяє економити до $15,000 на місяць для інфраструктури з 30 нод. Ми надаємо гарантію якості: налагоджені алерти та дашборди з сертифікованими інженерами з досвідом роботи понад 10 років.

Які метрики блокчейн-нод критичні?

Block height lag — відставання від мережі. Найважливіша метрика. Нода жива, але відстала — для RPC-сервісу це критично (клієнти отримують несвіжі дані), для validator — загроза slashing.

// Перевірка lag для EVM-сумісної ноди
async function checkBlockLag(nodeRpc: string, referenceRpc: string): Promise<number> {
    const [nodeBlock, referenceBlock] = await Promise.all([
        getBlockNumber(nodeRpc),
        getBlockNumber(referenceRpc),  // публічний ендпоінт як орієнтир
    ]);
    return referenceBlock - nodeBlock;
}

async function getBlockNumber(rpc: string): Promise<number> {
    const response = await fetch(rpc, {
        method: "POST",
        body: JSON.stringify({ jsonrpc: "2.0", method: "eth_blockNumber", id: 1 }),
        headers: { "Content-Type": "application/json" },
        signal: AbortSignal.timeout(5000),
    });
    const { result } = await response.json();
    return parseInt(result, 16);
}

Peer count — кількість підключених пірів. Низький peer count (< 5) означає проблеми з синхронізацією та потенційно ізольовану ноду. Eth net_peerCount, Cosmos /net_info.

Sync status — нода в режимі синхронізації чи вже синхронізована. eth_syncing повертає false або об'єкт з прогресом. Нода на sync не повинна приймати production трафік.

Mempool depth — кількість pending транзакцій. Для RPC-нод великий mempool може вказувати на проблеми з обробкою.

Validator-специфічні метрики (Cosmos, Ethereum PoS):

Missed blocks / attestations — пропущені підписи ведуть до slashing
Validator balance — при падінні нижче порогу ejection валідатор виключається
Double sign risk — моніторинг спроб подвійного підпису

Інфраструктурні метрики з блокчейн-контекстом

Стандартні CPU/RAM/Disk метрики критичні, але інтерпретуються по-різному. Ethereum full node споживає 1–2 TB на NVMe (не HDD). Різке зростання I/O може означати активну ресинхронізацію. Ethereum при повному навантаженні на RPC споживає 16–32 GB RAM — це норма, не витік.

Ефективне налаштування алертингу

Grafana Alerting або AlertManager. Ключовий принцип: різні severity для різних метрик. Не все потребує негайного реагування.

Метрика	Warning	Critical	Дія
Block lag (EVM)	> 10 блоків	> 50 блоків	Auto-restart або перемикання трафіку
Peer count	< 10	< 3	Перевірка firewall/network
Disk space	< 20%	< 10%	Розширення або pruning
Validator missed	> 1%	> 5%	Негайно (slashing risk)
Memory usage	> 80%	> 95%	Перевірка витоків, перезапуск

# alertmanager rules
groups:
  - name: blockchain-nodes
    rules:
      - alert: ValidatorMissedBlocks
        expr: rate(cosmos_validator_missed_blocks_total[5m]) > 0.05
        for: 2m
        labels:
          severity: critical
        annotations:
          summary: "Validator {{ $labels.validator }} missing >5% blocks"
          description: "Slashing risk. Immediate action required."

      - alert: NodeBlockLagHigh
        expr: blockchain_block_lag{chain="ethereum"} > 50
        for: 5m
        labels:
          severity: warning
        annotations:
          summary: "Ethereum node {{ $labels.instance }} lagging {{ $value }} blocks"

Як налаштувати auto-failover для RPC-нод?

Load balancer (HAProxy/nginx) перевіряє health-ендпоінт ноди, при failure — автоматично виключає з rotation. Health check для блокчейн-ноди повинен включати перевірку block lag, не тільки HTTP 200.

# Скрипт health check для HAProxy (викликається як external check)
import sys
import asyncio
from web3 import AsyncWeb3

MAX_LAG = 20  # максимально допустимий lag в блоках

async def check_node_health(node_url: str, reference_url: str) -> bool:
    try:
        w3_node = AsyncWeb3(AsyncWeb3.AsyncHTTPProvider(node_url, request_kwargs={"timeout": 3}))
        w3_ref = AsyncWeb3(AsyncWeb3.AsyncHTTPProvider(reference_url, request_kwargs={"timeout": 3}))

        node_block, ref_block = await asyncio.gather(
            w3_node.eth.block_number,
            w3_ref.eth.block_number,
        )
        return (ref_block - node_block) <= MAX_LAG
    except Exception:
        return False

if not asyncio.run(check_node_health(sys.argv[1], sys.argv[2])):
    sys.exit(1)

Покроковий процес розробки системи моніторингу

Аналітика та проєктування: Визначаємо список мереж, метрики, SLA. Обираємо набір експортерів: для стандартних ланцюжків — готові, для нестандартних — кастомні.
Налаштування збору метрик: Розгортаємо Prometheus + VictoriaMetrics. Конфігуруємо збір з кожної ноди з урахуванням scrape_interval.
Створення алерт-правил: Визначаємо пороги та інтеграції (Telegram, PagerDuty). Тестуємо на staging.
Реалізація auto-remediation: Для критичних сценаріїв — auto-failover (HAProxy/nginx) та watchdog для завислих нод.
Дашборди та документація: Будуємо Grafana дашборди: overview, per-network, validator performance. Готуємо runbook для команди.
Навчання та підтримка: Проводимо воркшоп для ваших інженерів. Надаємо документацію та супровід.

Порівняння готових експортерів для блокчейн-мереж

Експортер	Мережа	Метрики	Підтримка
`ethereum-exporter`	EVM-сумісні	block lag, peers, sync, txpool	Активна
`cosmos-validator-exporter`	Cosmos SDK	missed blocks, balance, commission	Frens Validator
`solana-exporter`	Solana	slot, health, vote accounts	Solana Foundation

Архітектура системи моніторингу

Collector шар

Для кожного типу ноди — спеціалізований collector, який переводить blockchain-специфічну телеметрію в уніфікований формат (Prometheus metrics).

// Collector для EVM-сумісних нод (Go)
type EVMNodeCollector struct {
    nodeRPC      string
    referenceRPC string
    nodeName     string
    chainID      string
}

func (c *EVMNodeCollector) Describe(ch chan<- *prometheus.Desc) {
    ch <- blockLagDesc
    ch <- peerCountDesc
    ch <- syncStatusDesc
    ch <- mempoolSizeDesc
}

func (c *EVMNodeCollector) Collect(ch chan<- prometheus.Metric) {
    ctx, cancel := context.WithTimeout(context.Background(), 10*time.Second)
    defer cancel()

    lag, err := c.getBlockLag(ctx)
    if err != nil {
        ch <- prometheus.NewInvalidMetric(blockLagDesc, err)
        return
    }

    ch <- prometheus.MustNewConstMetric(
        blockLagDesc,
        prometheus.GaugeValue,
        float64(lag),
        c.nodeName, c.chainID,
    )
    // ... інші метрики
}

Для Cosmos-based нод — парсинг /status, /net_info, /validators через RPC. Для Solana — JSON-RPC методи getHealth, getSlot, getVoteAccounts. Для Bitcoin — getblockchaininfo, getpeerinfo.

Агрегація та зберігання

Prometheus + VictoriaMetrics для довгострокового зберігання. VictoriaMetrics краща для мультимережевих операцій: краще стискає часові ряди, підтримує federated scraping з кількох Prometheus-інстансів.

# prometheus.yml — scrape config для мульти-нодового середовища
scrape_configs:
  - job_name: 'ethereum-nodes'
    scrape_interval: 15s
    scrape_timeout: 10s
    static_configs:
      - targets:
          - 'eth-node-1:9090'
          - 'eth-node-2:9090'
          - 'eth-node-3:9090'
    relabel_configs:
      - source_labels: [__address__]
        target_label: instance

  - job_name: 'cosmos-validators'
    scrape_interval: 30s  # Cosmos блок ~6 сек, 30 сек достатньо
    static_configs:
      - targets: ['cosmos-val-1:26660', 'cosmos-val-2:26660']

  - job_name: 'solana-rpc'
    scrape_interval: 10s  # Solana ~400ms слот, потрібна часта перевірка
    static_configs:
      - targets: ['solana-rpc-1:9101']

Дашборди

Grafana дашборди за структурою: Overview (всі ноди, всі мережі, статус одним поглядом), Per-network deep dive (детальні метрики по кожній мережі), Validator performance (для стейкінгових нод, включаючи APR та slashing ризики), Infrastructure (CPU/RAM/Disk по нодах).

Для публічних RPC-сервісів — додатково: метрики запитів (RPS, latency, error rate), rate limiting статистика, топ методів за навантаженням.

Терміни розробки

Компонент	Термін
Базові експортери (EVM + 1–2 інші мережі)	1–2 тижні
Prometheus + VictoriaMetrics + Grafana setup	3–5 днів
Алерт правила + PagerDuty/Telegram інтеграція	2–3 дні
Auto-failover для RPC	1 тиждень
Дашборди + документація	1 тиждень

Моніторинг для 3–5 мереж з базовими дашбордами та алертами — 3–4 тижні. Розширена система з auto-remediation та кастомними експортерами для нестандартних протоколів — 6–8 тижнів. Інвестиції в таку систему — від $5000 до $15000 залежно від кількості мереж та складності.

Що входить в роботу

Розробка кастомних експортерів для кожної мережі
Налаштування Prometheus + VictoriaMetrics + Grafana
Створення алерт-правил та інтеграція з Telegram/Slack
Реалізація auto-failover для RPC-нод
Створення дашбордів та документація
Навчання вашої команди

Зв'яжіться з нами для оцінки вашого проєкту. Отримайте консультацію щодо вашої конфігурації.

Ethereum

Розгортання блокчейн-інфраструктури: як уникнути простоїв?

Subgraph впав о 3:47 ночі. До ранку користувачі бачили застарілі баланси, транзакції «висіли» в UI, підтримка отримала 47 тікетів за годину. Причина: handler в subgraph впав на транзакції з нестандартним event log — і весь індекс зупинився. Ми стикалися з такими ситуаціями десятки разів. Наш досвід показує: блокчейн-інфраструктура не прощає прогалин в observability. Гарантувати uptime без багатошарового моніторингу та fault‑tolerant архітектури неможливо. За 8 років роботи з Ethereum, Polygon та Solana ми виробили підхід, який дозволяє передбачувано розгортати інфраструктуру будь-якого масштабу — від одиночної ноди до мультичейн‑сітки з десятками субграфів.

Архітектура RPC-шару

Кожна взаємодія dApp з блокчейном йде через RPC — JSON‑RPC API, яку надає нода. Три варіанти:

Managed providers — Alchemy, QuickNode, Infura, Ankr. Мінімальні операційні витрати, SLA, вбудований моніторинг. Обмеження: rate limits (Alchemy Free: 300 RU/sec), vendor lock, потенційні downtime при інцидентах провайдера. Для більшості проектів — правильний вибір на старті.

Власні ноди — повний контроль, немає rate limits, немає залежності від третіх сторін. Вартість: архівна нода Ethereum займає 2.5–3TB SSD, потребує потужний сервер та DevOps‑підтримку. Sync з нуля на Ethereum через Geth/Nethermind — 3–7 днів. Виправдано при високому навантаженні або вимогах до latency.

Гібрид — власна нода як primary, managed provider як fallback. Стандарт для протоколів з високим TVL. Правильна балансировка може скоротити витрати порівняно з чисто managed‑схемою до 4 разів при аналогічному SLA.

Провайдер	Сильна сторона	Обмеження
Alchemy	Supernode, Enhanced APIs, webhooks	Дорогий на high-volume
QuickNode	Низька latency, multi-chain	Дорожче Alchemy на базовому плані
Infura	Історична надійність	Rate limits на безкоштовному, один великий інцидент зупинив пів DeFi
Ankr	Дешевий, 40+ чейнів	Менш стабільний

Як налаштувати RPC-шар без єдиної точки відмови?

Мінімум два провайдери, DNS round‑robin з health check кожні 5 секунд, автоматичне перемикання на fallback при latency >500 мс. На практиці це дає 99.99% доступності при будь-якому збої провайдера. Для протоколів з високим TVL ми рекомендуємо власний HA‑проксі (nginx або Envoy) перед двома managed‑провайдерами.

Чому гібридна RPC-схема вигідніша за чисто managed?

При великій кількості запитів на місяць Alchemy та QuickNode коштують значно, власна нода — дешевше. Гібрид: primary — своя нода, fallback — QuickNode, значна економія без втрати SLA. Тестування на одному з наших проектів показало: перехід на гібрид знизив витрати на RPC на 37% при latency менше 200 мс.

Клієнти нод Ethereum

Execution clients: Geth (найбільш використовуваний), Nethermind (C#, швидка sync), Besu (Java, enterprise), Erigon (найшвидший sync, архівний режим ефективний по диску — ~2TB замість 3TB).

Consensus clients (post‑Merge): Lighthouse (Rust), Prysm (Go), Teku (Java), Nimbus (Nim). Кожна нода після The Merge потребує пари execution + consensus client.

Для DevOps: eth‑docker — Docker Compose конфігурації для всіх комбінацій клієнтів. Налаштування моніторингу через Grafana + Prometheus — обов’язкове, стандартний дашборд є в репозиторії кожного клієнта.

The Graph: індексація подій

The Graph Protocol — decentralized indexing. Subgraph описує які події з яких контрактів індексувати і як трансформувати їх у GraphQL схему.

Структура subgraph:

subgraph.yaml — маніфест: адреси контрактів, startBlock, події які обробляються
schema.graphql — GraphQL схема entities
src/mapping.ts — AssemblyScript обробники подій

dataSources:
  - kind: ethereum
    name: UniswapV3Pool
    network: mainnet
    source:
      address: "0x88e6A0c2dDD26FEEb64F039a2c41296FcB3f5640"
      abi: UniswapV3Pool
      startBlock: 12370624
    mapping:
      eventHandlers:
        - event: Swap(indexed address,indexed address,int256,int256,uint160,uint128,int24)
          handler: handleSwap

AssemblyScript handlers — не TypeScript. Немає nullable types, немає closures, немає багатьох стандартних API. Помилка в handler зупиняє індексацію subgraph-а на тій транзакції. Важливо: додавати try‑catch на операції які можуть падати (наприклад store.get() для entity яка може не існувати). Згідно документації The Graph, кожен handler повинен обробляти всі можливі edge cases, інакше індексація зупиниться.

Уникнення зупинки індексації субграфа

Лог файли Graph Node моніторяться в реальному часі, при hasIndexingErrors = true спрацьовує алерт і автоматичний рестарт ноди (через systemd або Kubernetes). Типовий downtime при помилці — 150–300 секунд до відновлення. Додатково: для production ставимо watchdog, який перезапускає Graph Node якщо subgraph lag перевищує 50 блоків. Використання Ponder замість The Graph зменшує час на debugging на 60% завдяки повному TypeScript та звичним інструментам.

Вибір між Hosted Service та Decentralized Network

Graph Hosted Service (безкоштовний, централізований) deprecated на користь Subgraph Studio + Graph Network. Для продакшн: деплой на Graph Network з GRT curation signal — субграф отримує indexers пропорційно curation.

Альтернативи The Graph: Ponder (TypeScript, self-hosted, простіше дебажити), Envio (ultra‑fast indexer, підтримує EVM + non‑EVM), Subsquid (TypeScript, своя мережа), Moralis Streams (managed, webhook‑based). Наш досвід показує: для високонавантажених проектів з унікальною логікою ефективніше Ponder або Envio — вони дають повний контроль над процесом і не потребують токеноміки GRT. Ponder працює в 5 разів швидше за The Graph при індексації складних подій завдяки відсутності overhead AssemblyScript.

Webhooks та real-time нотифікації

Alchemy Webhooks та QuickNode Streams дозволяють отримувати події в реальному часі через HTTP webhook або WebSocket. Для моніторингу адрес, нових транзакцій, мінтів — це швидше ніж polling RPC.

Tenderly — платформа для моніторингу та алертів. Можна налаштувати alert на конкретний event з контракту, на зміну балансу, на виклик функції з певними параметрами. Симуляція транзакцій через Tenderly API — безцінно для debugging.

Моніторинг та observability

Мінімальний стек моніторингу для протоколу:

On‑chain: OpenZeppelin Defender Sentinel — watches contract events, викликає webhook або Autotask при спрацьовуванні умов. Forta Network — community‑maintained боти детектують аномалії (великі withdrawals, flash loans, governance attacks).

Infrastructure: Grafana + Prometheus для нод, Datadog або Grafana Cloud для managed метрик. Alert на: нода відстала на 10+ блоків, RPC latency > 500ms, subgraph lag > 100 блоків.

Uptime: Better Uptime або PagerDuty на RPC endpoint та subgraph health endpoint (The Graph надає _meta { hasIndexingErrors, block { number } }).

Обмеження моніторингу без Tenderly

Tenderly дає симуляцію транзакцій та детальні трейси — це критично для налагодження помилок у субграфах та смарт‑контрактах. Forta ж фокусується на аномаліях у мережі, а не на вашій інфраструктурі. Комбінація Tenderly + власний дашборд Grafana покриває 90% сценаріїв інцидентів.

Мультичейн інфраструктура

Протокол на 5 чейнах = 5 окремих RPC endpoints, 5 subgraphs, 5 моніторинг‑конфігів. Це керовано, але потрібна автоматизація деплою.

Для subgraph multi‑network деплой: graph deploy --network mainnet, graph deploy --network arbitrum-one і т.д. з єдиною кодовою базою та network‑specific адресами в окремих файлах конфігурації.

Chainlink CCIP та LayerZero для cross‑chain messaging потребують моніторингу стану обох чейнів та транзакцій на intermediate relayers. Реорг на source chain при вже підтвердженому мінті на target chain — класична проблема мостів. Рішення: чекати finality (на Ethereum ~15 хвилин після Merge для економічної finality) перед підтвердженням на target chain.

Деталі автоматизації для 5+ чейнів

Для зменшення операційного навантаження використовуємо Terraform для розгортання інфраструктури, Ansible для налаштування нод та Kubernetes для оркестрації subgraph. Кожен чейн отримує окремий namespace з однаковими шаблонами моніторингу. Це дозволяє розгорнути новий чейн за 2 дні замість 2 тижнів.

Процес налаштування інфраструктури

Аудит поточного стеку — визначаємо чейни, обсяг запитів, вимоги до latency та доступності.
Проектування архітектури — вибір провайдерів, балансировка, redundancy.
Розробка subgraph — маніфест → схема → handlers → тестування на локальній Graph Node → деплой на testnet → mainnet.
Конфігурація моніторингу — Tenderly alerts, Grafana дашборд, PagerDuty інтеграція.
Документація та runbook — що робити при: subgraph fell behind, RPC downtime, нода desync.
Передача в експлуатацію — навчання команди, передача доступів, підтримка перший місяць.

Що входить у роботу?

Розгортання managed або self‑hosted нод Ethereum, Polygon, BNB Chain
Налаштування RPC‑шару з primary/fallback та load balancing
Розробка та деплой subgraph під ваш протокол
Підключення моніторингу (Tenderly, Grafana, алерти)
Створення runbook та документації з експлуатації
Навчання команди (до 4 годин онлайн)
Підтримка протягом 30 днів після здачі

Які терміни виконання?

Робота	Термін
Налаштування RPC та базового моніторингу	1–2 тижні
Subgraph для одного протоколу	2–4 тижні
Self-hosted нода з моніторингом	2–3 тижні
Повна інфраструктура (multi-chain, моніторинг, runbooks)	6–10 тижнів

Всі проекти ведуться в репозиторії на GitHub/GitLab з CI/CD, код конфігурацій залишається у вас. Замовте розгортання інфраструктури — розкажемо, як скоротити витрати без втрати надійності. Отримайте консультацію — покажемо, як ми розгортали інфраструктуру для протоколу з високим TVL на Ethereum та Arbitrum. Зв'яжіться з нами.