Реалізація алертів при збоях парсингу (email/Telegram)

Наша компанія займається розробкою, підтримкою та обслуговуванням сайтів будь-якої складності. Від простих односторінкових сайтів до масштабних кластерних систем, побудованих на мікро сервісах. Досвід розробників підтверджено сертифікатами від вендорів.

Розробка та обслуговування будь-яких видів сайтів:

Інформаційні сайти або веб-програми
Сайти візитки, landing page, корпоративні сайти, онлайн каталоги, квіз, промо-сайти, блоги, ресурси новин, інформаційні портали, форуми, агрегатори
Сайти або веб-програми електронної комерції
Інтернет-магазини, B2B-портали, маркетплейси, онлайн-обмінники, кешбек-сайти, біржі, дропшиппінг-платформи, парсери товарів
Веб-програми для управління бізнес-процесами
CRM-системи, ERP-системи, корпоративні портали, системи управління виробництвом, парсери інформації
Сайти або веб-програми електронних послуг
Дошки оголошень, онлайн-школи, онлайн-кінотеатри, конструктори сайтів, портали надання електронних послуг, відеохостинги, тематичні портали

Це лише деякі з технічних типів сайтів, з якими ми працюємо, і кожен із них може мати свої специфічні особливості та функціональність, а також бути адаптованим під конкретні потреби та цілі клієнта.

Пропоновані послуги
Показано 1 з 1 послугУсі 2065 послуг
Реалізація алертів при збоях парсингу (email/Telegram)
Проста
від 1 робочого дня до 3 робочих днів
Часті питання

Наші компетенції:

Етапи розробки

Останні роботи

  • image_website-b2b-advance_0.png
    Розробка сайту компанії B2B ADVANCE
    1262
  • image_web-applications_feedme_466_0.webp
    Розробка веб-додатків для компанії FEEDME
    1171
  • image_websites_belfingroup_462_0.webp
    Розробка веб-сайту для компанії БЕЛФІНГРУП
    874
  • image_ecommerce_furnoro_435_0.webp
    Розробка інтернет магазину для компанії FURNORO
    1094
  • image_crm_enviok_479_0.webp
    Розробка веб-додатків для компанії Enviok
    831
  • image_bitrix-bitrix-24-1c_fixper_448_0.png
    Розробка веб-сайту для компанії ФІКСПЕР
    851

Реалізація алертів при збоях скрейпінгу (email/Telegram)

Парсер упав ночами — вранці дані застарілі, і ніхто не знає чому. Система алертів вирішує це: потрібна людина отримує сповіщення в момент збою, з достатнім контекстом для діагностики.

Що вважається збоєм

Не кожна помилка потребує алерту. Одиничний таймаут — штатна ситуація, воркер повторить спробу. Алерт потрібен коли:

  • Завдання вичерпало всі спроби (перенесено в DLQ / остаточний збій)
  • Воркер упав сам (process crash, OOM)
  • Відсоток помилок за останні 15 хвилин перевищив поріг (напр. > 20%)
  • Скрейпінг сайту не завершився за очікуваний час (watchdog timeout)
  • Змінилась структура сторінки — парсер повертає порожні дані

Сповіщення у Telegram

import httpx
import textwrap

async def send_telegram_alert(bot_token: str, chat_id: str, event: dict):
    text = textwrap.dedent(f"""
        🔴 <b>Збій скрейпінгу</b>

        <b>Сайт:</b> {event['site_name']}
        <b>URL:</b> <code>{event['url']}</code>
        <b>Помилка:</b> {event['error_type']}
        <b>Повідомлення:</b> <code>{event['error_message'][:300]}</code>
        <b>Спроб:</b> {event['attempts']}
        <b>Час:</b> {event['timestamp']}
    """).strip()

    async with httpx.AsyncClient() as client:
        await client.post(
            f"https://api.telegram.org/bot{bot_token}/sendMessage",
            json={"chat_id": chat_id, "text": text, "parse_mode": "HTML"},
            timeout=10,
        )

Email через SMTP / SendGrid

from sendgrid import SendGridAPIClient
from sendgrid.helpers.mail import Mail

def send_email_alert(to_email: str, event: dict):
    message = Mail(
        from_email='[email protected]',
        to_emails=to_email,
        subject=f"[Скрейпінг] Збій: {event['site_name']}",
        html_content=render_alert_template(event),
    )
    sg = SendGridAPIClient(api_key=SENDGRID_API_KEY)
    sg.send(message)

Дедупліцірація алертів

Без дедупліцірації при масовому збої (упав постачальник проксі) прийде 500 писем за хвилину. Рішення — групування за ключем з cooldown:

def should_send_alert(site_id: int, error_type: str, cooldown_minutes: int = 30) -> bool:
    key = f"alert_sent:{site_id}:{error_type}"
    if redis.exists(key):
        return False
    redis.setex(key, cooldown_minutes * 60, "1")
    return True

Один алерт на тип помилки за 30 хвилин — розумний баланс між інформативністю та шумом.

Час реалізації

Telegram + email алерти з дедупліцірацією — 1–2 робочі дні.