Що таке StartLimitBurst і для чого він потрібен?

Це параметр systemd, що обмежує кількість перезапусків за заданий інтервал. Наприклад, StartLimitBurst=5 протягом StartLimitIntervalSec=60 секунд означає: якщо бот впав 5 разів за хвилину, systemd припиняє його запуск. Це захищає від crash loop'у та дозволяє уникнути подвійних ордерів.

Як реалізувати graceful shutdown торгового бота?

Обробіть сигнал SIGTERM: у Python використовуйте loop.add_signal_handler(signal.SIGTERM, shutdown). У shutdown скасуйте відкриті ордери, збережіть стан і закрийте з'єднання. systemd за замовчуванням чекає 90 секунд (TimeoutStopSec), цього достатньо для більшості ботів.

Чим Docker restart policy відрізняється від systemd?

Docker restart: unless-stopped перезапускає контейнер при падінні та після перезавантаження хоста, але не при ручному зупиненні. systemd restart: always перезапускає навіть після ручного вимкнення. Docker не має вбудованого захисту від crash loop'у, його потрібно реалізовувати health check'ом.

Як налаштувати алерти при падінні торгового бота?

Використовуйте systemd OnFailure — при збої сервісу запускається notify-скрипт, що надсилає повідомлення в Telegram. Або налаштуйте Prometheus alert: правило changes(process_start_time_seconds[5m]) > 0 сповістить про часті рестарти. Мінімум — Telegram-бота з ім'ям хоста та часом.

Що таке StartLimitBurst і для чого він потрібен?

Це параметр systemd, що обмежує кількість перезапусків за заданий інтервал. Наприклад, StartLimitBurst=5 протягом StartLimitIntervalSec=60 секунд означає: якщо бот впав 5 разів за хвилину, systemd припиняє його запуск. Це захищає від crash loop'у та дозволяє уникнути подвійних ордерів.

Як реалізувати graceful shutdown торгового бота?

Обробіть сигнал SIGTERM: у Python використовуйте loop.add_signal_handler(signal.SIGTERM, shutdown). У shutdown скасуйте відкриті ордери, збережіть стан і закрийте з'єднання. systemd за замовчуванням чекає 90 секунд (TimeoutStopSec), цього достатньо для більшості ботів.

Чим Docker restart policy відрізняється від systemd?

Docker restart: unless-stopped перезапускає контейнер при падінні та після перезавантаження хоста, але не при ручному зупиненні. systemd restart: always перезапускає навіть після ручного вимкнення. Docker не має вбудованого захисту від crash loop'у, його потрібно реалізовувати health check'ом.

Як налаштувати алерти при падінні торгового бота?

Використовуйте systemd OnFailure — при збої сервісу запускається notify-скрипт, що надсилає повідомлення в Telegram. Або налаштуйте Prometheus alert: правило changes(process_start_time_seconds[5m]) > 0 сповістить про часті рестарти. Мінімум — Telegram-бота з ім'ям хоста та часом.

Автоперезапуск торгового бота: systemd, Docker, алерти

Проєктуємо та розробляємо блокчейн-рішення повного циклу: від архітектури смарт-контрактів до запуску DeFi-протоколів, NFT-маркетплейсів та криптобірж. Аудит безпеки, токеноміка, інтеграція з наявною інфраструктурою.

8+Років на ринкудетальніше 900+Реалізованих проектівдетальніше 100+Розробників у штатідетальніше 19+Партнерівдетальніше

Послуги, які ми пропонуємо

Показано 1 з 1Усі 1305 послуг

Автоперезапуск торгового бота: systemd, Docker, алерти

Простий

~1 день

Часті запитання

Напрямки блокчейн-розробки

Обговорити блокчейн-проєкт

Безкоштовна консультація — розповімо, як блокчейн вирішить вашу задачу

Оцінити вартість

Розрахуємо бюджет та терміни вашого блокчейн-проєкту

Етапи блокчейн-розробки

Останні роботи

Розробка сайту компанії B2B ADVANCE
1359
Розробка веб-додатків для компанії FEEDME
1251
Розробка веб-сайту для компанії БЕЛФІНГРУП
957
Розробка інтернет магазину для компанії FURNORO
1188
Розробка логотипу компанії B2B Advance
646
Розробка веб-додатків для компанії Enviok
929

Показати більше робіт

Налаштування автоматичного перезапуску торгового бота

Торговий бот працює 24/7. Збій через мережеву помилку, OOM, необроблене виключення або оновлення системи — і процес падає. Без автоперезапуску бот залишається мертвим, поки не втрутиться оператор. Чим довший простій, тим більше втрачений прибуток і ризик пропустити торгові сигнали. У production ми досягаємо uptime 99.9% завдяки зв'язці systemd, graceful shutdown та алертів. Розкажу, як це налаштувати, на прикладі реального проекту: бот на Python з aiohttp, що працює на Ubuntu 22.04 з 4 ядрами. Ми використовуємо systemd для керування, Docker для ізоляції та Prometheus для моніторингу.

systemd — стандартний менеджер сервісів у Linux. Він вміє автоматично перезапускати процес, обмежувати ресурси та логувати. Але одного налаштування Restart=always недостатньо — потрібен захист від crash loop. Розглянемо три ключові компоненти: systemd unit, graceful shutdown у коді бота та алерти при збоях. Для контейнеризованих ботів доповнимо Docker restart policy та health check.

Як налаштувати systemd для автоматичного перезапуску?

Створіть unit-файл у /etc/systemd/system/ з параметрами Restart=always та RestartSec=10. Додатково вкажіть StartLimitBurst=5 і StartLimitIntervalSec=60, щоб уникнути нескінченного перезапуску при критичній помилці. Активуйте сервіс: systemctl enable trading-bot.

# /etc/systemd/system/trading-bot.service

[Unit]
Description=Trading Bot
After=network-online.target
Wants=network-online.target

[Service]
Type=simple
User=botuser
WorkingDirectory=/opt/trading-bot
ExecStart=/opt/trading-bot/venv/bin/python -u bot.py
Restart=always
RestartSec=10
StartLimitIntervalSec=60
StartLimitBurst=5

EnvironmentFile=/opt/trading-bot/.env
MemoryLimit=2G
CPUQuota=80%

StandardOutput=journal
StandardError=journal
SyslogIdentifier=trading-bot

[Install]
WantedBy=multi-user.target

Активація:

systemctl daemon-reload
systemctl enable trading-bot
systemctl start trading-bot
journalctl -u trading-bot -f   # live логи

Параметр StartLimitBurst=5 + StartLimitIntervalSec=60 — захист від crash loop. Без нього бот при постійних падіннях буде безперервно перезапускатися, накопичуючи помилки (відкриті позиції, дублюючі ордери). Після 5 швидких падінь systemd зупинить службу та надішле алерт (якщо налаштовано). Це в 5 разів надійніше, ніж простий cron-моніторинг.

Параметри systemd unit: детальний розбір

Параметр	Опис	Приклад
Restart	Політика перезапуску	always
RestartSec	Пауза між рестартами	10
StartLimitBurst	Ліміт швидких перезапусків	5
StartLimitIntervalSec	Інтервал для ліміту	60
MemoryLimit	Обмеження пам'яті	2G
CPUQuota	Квоти CPU	80%

Ці параметри підвищують стабільність: бот не падає через перевантаження, а при частих помилках systemd блокує запуск, запобігаючи втраті коштів через подвійні ордери.

Що таке graceful shutdown і для чого він потрібен?

Бота не можна вбивати SIGKILL — можна залишити відкриті ордери, незафіксовані позиції, невідправлені алерти. Обробляємо SIGTERM:

import signal
import asyncio

class TradingBot:
    def __init__(self):
        self.running = True
        self.open_orders: list = []

    async def shutdown(self):
        self.running = False
        for order_id in self.open_orders:
            try:
                await self.exchange.cancel_order(order_id)
            except Exception as e:
                logger.error(f"Failed to cancel order {order_id}: {e}")
        logger.info("Graceful shutdown complete")

    async def run(self):
        loop = asyncio.get_event_loop()
        loop.add_signal_handler(
            signal.SIGTERM,
            lambda: asyncio.create_task(self.shutdown())
        )

        while self.running:
            try:
                await self.main_loop()
            except Exception as e:
                logger.exception(f"Error in main loop: {e}")
                await asyncio.sleep(5)

systemd при systemctl stop надсилає SIGTERM, потім через TimeoutStopSec (default 90 сек) — SIGKILL. Для бота з позиціями 90 секунд зазвичай достатньо.

Docker: альтернатива для контейнеризованих ботів

Якщо бот запускається в Docker, використовуйте restart: unless-stopped — він перезапускає при падінні та при перезавантаженні хоста, але не при ручному зупиненні. Health check критично важливий: Docker перезапускає контейнер лише при повному падінні, а зависання без помилки не помітить.

# docker-compose.yml
services:
  trading-bot:
    image: trading-bot:latest
    restart: unless-stopped
    env_file: .env
    volumes:
      - ./data:/app/data
      - ./logs:/app/logs
    mem_limit: 2g
    logging:
      driver: "json-file"
      options:
        max-size: "100m"
        max-file: "5"
    healthcheck:
      test: ["CMD", "python", "-c", "import requests; requests.get('http://localhost:8080/health', timeout=5)"]
      interval: 30s
      timeout: 10s
      retries: 3
      start_period: 60s

Приклад health-ендпоінта на aiohttp:

from aiohttp import web

async def health_check(request):
    last_loop_age = time.time() - bot.last_loop_time
    if last_loop_age > 300:
        return web.Response(status=503, text=f"Bot stuck: last loop {last_loop_age:.0f}s ago")
    if not bot.exchange_connected:
        return web.Response(status=503, text="Exchange disconnected")
    return web.Response(status=200, text="OK")

app = web.Application()
app.router.add_get('/health', health_check)

Порівняння systemd та Docker для автоперезапуску

Параметр	systemd	Docker
Механізм перезапуску	systemd unit	restart policy
Захист від crash loop	StartLimitBurst + Interval	Немає вбудованого (тільки health)
Graceful shutdown	SIGTERM + TimeoutStopSec	SIGTERM + stop_grace_period
Моніторинг зависань	Немає вбудованого	Health check
Рекомендація	Для власних Linux‑серверів	Для контейнеризованої інфраструктури

Чому потрібні алерти при падінні?

Сам факт перезапуску повинен генерувати сповіщення — навіть якщо бот відновився автоматично. Мінімальне рішення — Telegram-бот з ім'ям хоста та часом. У systemd це робиться через OnFailure=trading-bot-notify.service. Для Prometheus: правило changes(process_start_time_seconds{job="trading-bot"}[5m]) > 0. Отримайте консультацію з налаштування алертів — підкажемо оптимальне рішення для вашої інфраструктури.

Що входить у налаштування автоматичного перезапуску (deliverables)

Конфігурація systemd unit або Docker compose з захистом від crash loop
Реалізація graceful shutdown з обробкою відкритих ордерів
Health check endpoint з перевіркою стану бота та біржі
Налаштування алертів (Telegram / Slack) при падінні та частих рестартах
Тестування на staging-оточенні до виходу в production
Документація конфігурації та інструкція для вашої команди
5+ років досвіду в блокчейн-розробці — гарантуємо стабільність

Приклад crash loop та його наслідки

Якщо бот падає кожні 5 секунд через помилку підключення до біржі, без StartLimitBurst systemd буде перезапускати його нескінченно. Кожен запуск може спробувати скасувати ордери або створити нові, що призведе до подвійних позицій. З StartLimitBurst=5 після п'ятої спроби systemd зупинить сервіс, і ви отримаєте алерт. Це врятує від фінансових втрат.

Замовте налаштування торгового бота в компанії TrueTech — ми забезпечимо стабільну роботу 24/7. Отримайте консультацію з конфігурації systemd, Docker та алертів.

Розгортання блокчейн-інфраструктури: як уникнути простоїв?

Subgraph впав о 3:47 ночі. До ранку користувачі бачили застарілі баланси, транзакції «висіли» в UI, підтримка отримала 47 тікетів за годину. Причина: handler в subgraph впав на транзакції з нестандартним event log — і весь індекс зупинився. Ми стикалися з такими ситуаціями десятки разів. Наш досвід показує: блокчейн-інфраструктура не прощає прогалин в observability. Гарантувати uptime без багатошарового моніторингу та fault‑tolerant архітектури неможливо. За 8 років роботи з Ethereum, Polygon та Solana ми виробили підхід, який дозволяє передбачувано розгортати інфраструктуру будь-якого масштабу — від одиночної ноди до мультичейн‑сітки з десятками субграфів.

Архітектура RPC-шару

Кожна взаємодія dApp з блокчейном йде через RPC — JSON‑RPC API, яку надає нода. Три варіанти:

Managed providers — Alchemy, QuickNode, Infura, Ankr. Мінімальні операційні витрати, SLA, вбудований моніторинг. Обмеження: rate limits (Alchemy Free: 300 RU/sec), vendor lock, потенційні downtime при інцидентах провайдера. Для більшості проектів — правильний вибір на старті.

Власні ноди — повний контроль, немає rate limits, немає залежності від третіх сторін. Вартість: архівна нода Ethereum займає 2.5–3TB SSD, потребує потужний сервер та DevOps‑підтримку. Sync з нуля на Ethereum через Geth/Nethermind — 3–7 днів. Виправдано при високому навантаженні або вимогах до latency.

Гібрид — власна нода як primary, managed provider як fallback. Стандарт для протоколів з високим TVL. Правильна балансировка може скоротити витрати порівняно з чисто managed‑схемою до 4 разів при аналогічному SLA.

Провайдер	Сильна сторона	Обмеження
Alchemy	Supernode, Enhanced APIs, webhooks	Дорогий на high-volume
QuickNode	Низька latency, multi-chain	Дорожче Alchemy на базовому плані
Infura	Історична надійність	Rate limits на безкоштовному, один великий інцидент зупинив пів DeFi
Ankr	Дешевий, 40+ чейнів	Менш стабільний

Як налаштувати RPC-шар без єдиної точки відмови?

Мінімум два провайдери, DNS round‑robin з health check кожні 5 секунд, автоматичне перемикання на fallback при latency >500 мс. На практиці це дає 99.99% доступності при будь-якому збої провайдера. Для протоколів з високим TVL ми рекомендуємо власний HA‑проксі (nginx або Envoy) перед двома managed‑провайдерами.

Чому гібридна RPC-схема вигідніша за чисто managed?

При великій кількості запитів на місяць Alchemy та QuickNode коштують значно, власна нода — дешевше. Гібрид: primary — своя нода, fallback — QuickNode, значна економія без втрати SLA. Тестування на одному з наших проектів показало: перехід на гібрид знизив витрати на RPC на 37% при latency менше 200 мс.

Клієнти нод Ethereum

Execution clients: Geth (найбільш використовуваний), Nethermind (C#, швидка sync), Besu (Java, enterprise), Erigon (найшвидший sync, архівний режим ефективний по диску — ~2TB замість 3TB).

Consensus clients (post‑Merge): Lighthouse (Rust), Prysm (Go), Teku (Java), Nimbus (Nim). Кожна нода після The Merge потребує пари execution + consensus client.

Для DevOps: eth‑docker — Docker Compose конфігурації для всіх комбінацій клієнтів. Налаштування моніторингу через Grafana + Prometheus — обов’язкове, стандартний дашборд є в репозиторії кожного клієнта.

The Graph: індексація подій

The Graph Protocol — decentralized indexing. Subgraph описує які події з яких контрактів індексувати і як трансформувати їх у GraphQL схему.

Структура subgraph:

subgraph.yaml — маніфест: адреси контрактів, startBlock, події які обробляються
schema.graphql — GraphQL схема entities
src/mapping.ts — AssemblyScript обробники подій

dataSources:
  - kind: ethereum
    name: UniswapV3Pool
    network: mainnet
    source:
      address: "0x88e6A0c2dDD26FEEb64F039a2c41296FcB3f5640"
      abi: UniswapV3Pool
      startBlock: 12370624
    mapping:
      eventHandlers:
        - event: Swap(indexed address,indexed address,int256,int256,uint160,uint128,int24)
          handler: handleSwap

AssemblyScript handlers — не TypeScript. Немає nullable types, немає closures, немає багатьох стандартних API. Помилка в handler зупиняє індексацію subgraph-а на тій транзакції. Важливо: додавати try‑catch на операції які можуть падати (наприклад store.get() для entity яка може не існувати). Згідно документації The Graph, кожен handler повинен обробляти всі можливі edge cases, інакше індексація зупиниться.

Уникнення зупинки індексації субграфа

Лог файли Graph Node моніторяться в реальному часі, при hasIndexingErrors = true спрацьовує алерт і автоматичний рестарт ноди (через systemd або Kubernetes). Типовий downtime при помилці — 150–300 секунд до відновлення. Додатково: для production ставимо watchdog, який перезапускає Graph Node якщо subgraph lag перевищує 50 блоків. Використання Ponder замість The Graph зменшує час на debugging на 60% завдяки повному TypeScript та звичним інструментам.

Вибір між Hosted Service та Decentralized Network

Graph Hosted Service (безкоштовний, централізований) deprecated на користь Subgraph Studio + Graph Network. Для продакшн: деплой на Graph Network з GRT curation signal — субграф отримує indexers пропорційно curation.

Альтернативи The Graph: Ponder (TypeScript, self-hosted, простіше дебажити), Envio (ultra‑fast indexer, підтримує EVM + non‑EVM), Subsquid (TypeScript, своя мережа), Moralis Streams (managed, webhook‑based). Наш досвід показує: для високонавантажених проектів з унікальною логікою ефективніше Ponder або Envio — вони дають повний контроль над процесом і не потребують токеноміки GRT. Ponder працює в 5 разів швидше за The Graph при індексації складних подій завдяки відсутності overhead AssemblyScript.

Webhooks та real-time нотифікації

Alchemy Webhooks та QuickNode Streams дозволяють отримувати події в реальному часі через HTTP webhook або WebSocket. Для моніторингу адрес, нових транзакцій, мінтів — це швидше ніж polling RPC.

Tenderly — платформа для моніторингу та алертів. Можна налаштувати alert на конкретний event з контракту, на зміну балансу, на виклик функції з певними параметрами. Симуляція транзакцій через Tenderly API — безцінно для debugging.

Моніторинг та observability

Мінімальний стек моніторингу для протоколу:

On‑chain: OpenZeppelin Defender Sentinel — watches contract events, викликає webhook або Autotask при спрацьовуванні умов. Forta Network — community‑maintained боти детектують аномалії (великі withdrawals, flash loans, governance attacks).

Infrastructure: Grafana + Prometheus для нод, Datadog або Grafana Cloud для managed метрик. Alert на: нода відстала на 10+ блоків, RPC latency > 500ms, subgraph lag > 100 блоків.

Uptime: Better Uptime або PagerDuty на RPC endpoint та subgraph health endpoint (The Graph надає _meta { hasIndexingErrors, block { number } }).

Обмеження моніторингу без Tenderly

Tenderly дає симуляцію транзакцій та детальні трейси — це критично для налагодження помилок у субграфах та смарт‑контрактах. Forta ж фокусується на аномаліях у мережі, а не на вашій інфраструктурі. Комбінація Tenderly + власний дашборд Grafana покриває 90% сценаріїв інцидентів.

Мультичейн інфраструктура

Протокол на 5 чейнах = 5 окремих RPC endpoints, 5 subgraphs, 5 моніторинг‑конфігів. Це керовано, але потрібна автоматизація деплою.

Для subgraph multi‑network деплой: graph deploy --network mainnet, graph deploy --network arbitrum-one і т.д. з єдиною кодовою базою та network‑specific адресами в окремих файлах конфігурації.

Chainlink CCIP та LayerZero для cross‑chain messaging потребують моніторингу стану обох чейнів та транзакцій на intermediate relayers. Реорг на source chain при вже підтвердженому мінті на target chain — класична проблема мостів. Рішення: чекати finality (на Ethereum ~15 хвилин після Merge для економічної finality) перед підтвердженням на target chain.

Деталі автоматизації для 5+ чейнів

Для зменшення операційного навантаження використовуємо Terraform для розгортання інфраструктури, Ansible для налаштування нод та Kubernetes для оркестрації subgraph. Кожен чейн отримує окремий namespace з однаковими шаблонами моніторингу. Це дозволяє розгорнути новий чейн за 2 дні замість 2 тижнів.

Процес налаштування інфраструктури

Аудит поточного стеку — визначаємо чейни, обсяг запитів, вимоги до latency та доступності.
Проектування архітектури — вибір провайдерів, балансировка, redundancy.
Розробка subgraph — маніфест → схема → handlers → тестування на локальній Graph Node → деплой на testnet → mainnet.
Конфігурація моніторингу — Tenderly alerts, Grafana дашборд, PagerDuty інтеграція.
Документація та runbook — що робити при: subgraph fell behind, RPC downtime, нода desync.
Передача в експлуатацію — навчання команди, передача доступів, підтримка перший місяць.

Що входить у роботу?

Розгортання managed або self‑hosted нод Ethereum, Polygon, BNB Chain
Налаштування RPC‑шару з primary/fallback та load balancing
Розробка та деплой subgraph під ваш протокол
Підключення моніторингу (Tenderly, Grafana, алерти)
Створення runbook та документації з експлуатації
Навчання команди (до 4 годин онлайн)
Підтримка протягом 30 днів після здачі

Які терміни виконання?

Робота	Термін
Налаштування RPC та базового моніторингу	1–2 тижні
Subgraph для одного протоколу	2–4 тижні
Self-hosted нода з моніторингом	2–3 тижні
Повна інфраструктура (multi-chain, моніторинг, runbooks)	6–10 тижнів

Всі проекти ведуться в репозиторії на GitHub/GitLab з CI/CD, код конфігурацій залишається у вас. Замовте розгортання інфраструктури — розкажемо, як скоротити витрати без втрати надійності. Отримайте консультацію — покажемо, як ми розгортали інфраструктуру для протоколу з високим TVL на Ethereum та Arbitrum. Зв'яжіться з нами.