Реализация мониторинга изменений цен/наличия на внешних сайтах

Наша компания занимается разработкой, поддержкой и обслуживанием сайтов любой сложности. От простых одностраничных сайтов до масштабных кластерных систем построенных на микро сервисах. Опыт разработчиков подтвержден сертификатами от вендоров.

Разработка и обслуживание любых видов сайтов:

Информационные сайты или веб-приложения
Сайты визитки, landing page, корпоративные сайты, онлайн каталоги, квиз, промо-сайты, блоги, новостные ресурсы, информационные порталы, форумы, агрегаторы
Сайты или веб-приложения электронной коммерции
Интернет-магазины, B2B-порталы, маркетплейсы, онлайн-обменники, кэшбэк-сайты, биржи, дропшиппинг-платформы, парсеры товаров
Веб-приложения для управления бизнес-процессами
CRM-системы, ERP-системы, корпоративные порталы, системы управления производством, парсеры информации
Сайты или веб-приложения электронных услуг
Доски объявлений, онлайн-школы, онлайн-кинотеатры, конструкторы сайтов, порталы предоставления электронных услуг, видеохостинги, тематические порталы

Это лишь некоторые из технических типов сайтов, с которыми мы работаем, и каждый из них может иметь свои специфические особенности и функциональность, а также быть адаптированным под конкретные потребности и цели клиента

Предлагаемые услуги
Показано 1 из 1 услугВсе 2065 услуг
Реализация мониторинга изменений цен/наличия на внешних сайтах
Средняя
~3-5 рабочих дней
Часто задаваемые вопросы

Наши компетенции:

Этапы разработки

Последние работы

  • image_website-b2b-advance_0.png
    Разработка сайта компании B2B ADVANCE
    1262
  • image_web-applications_feedme_466_0.webp
    Разработка веб-приложения для компании FEEDME
    1171
  • image_websites_belfingroup_462_0.webp
    Разработка веб-сайта для компании БЕЛФИНГРУПП
    874
  • image_ecommerce_furnoro_435_0.webp
    Разработка интернет магазина для компании FURNORO
    1094
  • image_crm_enviok_479_0.webp
    Разработка веб-приложения для компании Enviok
    831
  • image_bitrix-bitrix-24-1c_fixper_448_0.png
    Разработка веб-сайта для компании ФИКСПЕР
    851

Реализация мониторинга изменений цен/наличия на внешних сайтах

Мониторинг внешних сайтов нужен в двух сценариях: отслеживание дистрибьюторов (не нарушают ли рекомендованную цену) и отслеживание конкурентов по конкретным SKU для оперативного реагирования. В обоих случаях нужна система, которая регулярно снимает показания с указанных URL и сигнализирует при отклонениях.

Структура системы

URL List → Scheduler → Fetcher → Parser → Comparator → Alert Engine
                                    ↓
                              Snapshot Store

Ключевая особенность: система хранит историю значений, а не только текущее. Это позволяет строить графики изменений и видеть паттерны.

Модель данных

CREATE TABLE watch_targets (
    id              BIGSERIAL PRIMARY KEY,
    url             TEXT NOT NULL UNIQUE,
    label           VARCHAR(255),              -- "DNS: Samsung S24 256GB"
    our_product_id  BIGINT REFERENCES products(id),
    site_id         INT REFERENCES external_sites(id),
    check_interval  INTERVAL DEFAULT '4 hours',
    price_selector  VARCHAR(500),
    stock_selector  VARCHAR(500),
    price_type      VARCHAR(20) DEFAULT 'text', -- 'text', 'attr', 'json', 'meta'
    price_attr      VARCHAR(100),              -- для type=attr или meta
    price_regex     VARCHAR(255),              -- доп. очистка через regex
    alert_threshold_pct NUMERIC(5,2) DEFAULT 5.0, -- уведомлять при изменении > N%
    is_active       BOOLEAN DEFAULT TRUE,
    last_checked_at TIMESTAMP,
    last_price      NUMERIC(12,2),
    last_in_stock   BOOLEAN
);

CREATE TABLE watch_snapshots (
    id              BIGSERIAL PRIMARY KEY,
    target_id       BIGINT REFERENCES watch_targets(id) ON DELETE CASCADE,
    price           NUMERIC(12,2),
    in_stock        BOOLEAN,
    raw_price_text  VARCHAR(200),
    http_status     SMALLINT,
    error           TEXT,
    captured_at     TIMESTAMP DEFAULT NOW()
);

CREATE INDEX idx_snapshots_target_time ON watch_snapshots(target_id, captured_at DESC);

Гибкий парсер цены

Разные сайты хранят цену по-разному. Парсер поддерживает несколько режимов:

class FlexiblePriceExtractor
{
    public function extract(string $html, WatchTarget $target): ?ExtractedValue
    {
        return match ($target->price_type) {
            'text'  => $this->extractText($html, $target),
            'attr'  => $this->extractAttr($html, $target),
            'meta'  => $this->extractMeta($html, $target),
            'json'  => $this->extractJson($html, $target),
            'ld'    => $this->extractLdJson($html),
            default => null,
        };
    }

    private function extractLdJson(string $html): ?ExtractedValue
    {
        // Schema.org Product markup — универсальный для многих магазинов
        $crawler = new Crawler($html);
        $nodes   = $crawler->filter('script[type="application/ld+json"]');

        foreach ($nodes as $node) {
            $data = json_decode($node->textContent, true);
            if (!$data) continue;

            $type  = $data['@type'] ?? $data[0]['@type'] ?? null;
            if (!in_array($type, ['Product', 'Offer'])) continue;

            $offer = $data['offers'] ?? $data;
            if (is_array($offer) && isset($offer[0])) $offer = $offer[0];

            $price    = $offer['price'] ?? null;
            $inStock  = ($offer['availability'] ?? '') === 'https://schema.org/InStock';

            if ($price !== null) {
                return new ExtractedValue(
                    price:   (float) $price,
                    inStock: $inStock,
                    rawText: (string) $price,
                    method:  'ld_json',
                );
            }
        }

        return null;
    }

    private function extractMeta(string $html, WatchTarget $target): ?ExtractedValue
    {
        // Open Graph / meta теги: <meta property="product:price:amount" content="29990">
        $crawler  = new Crawler($html);
        $selector = "meta[property='{$target->price_attr}'], meta[name='{$target->price_attr}']";

        try {
            $content = $crawler->filter($selector)->attr('content');
            return $this->parseNumeric($content);
        } catch (\Exception $e) {
            return null;
        }
    }

    private function extractText(string $html, WatchTarget $target): ?ExtractedValue
    {
        if (!$target->price_selector) return null;

        $crawler = new Crawler($html);
        try {
            $text = $crawler->filter($target->price_selector)->first()->text();

            if ($target->price_regex) {
                preg_match($target->price_regex, $text, $m);
                $text = $m[1] ?? $text;
            }

            return $this->parseNumeric($text);
        } catch (\Exception $e) {
            return null;
        }
    }

    private function parseNumeric(string $raw): ?ExtractedValue
    {
        $clean = preg_replace('/[^\d.,]/', '', $raw);
        $clean = str_replace(',', '.', $clean);

        // "29.990" (разделитель тысяч точкой) → "29990"
        if (preg_match('/^\d{1,3}\.\d{3}$/', $clean)) {
            $clean = str_replace('.', '', $clean);
        }

        if (!is_numeric($clean) || (float) $clean <= 0) return null;

        return new ExtractedValue(price: (float) $clean, rawText: $raw);
    }
}

Job проверки цели

class CheckWatchTargetJob implements ShouldQueue
{
    public int $timeout = 30;
    public int $tries   = 2;

    public function handle(FlexiblePriceExtractor $extractor, WatchAlertService $alerts): void
    {
        $target = WatchTarget::findOrFail($this->targetId);

        // Fetch
        $response = $this->fetch($target->url);
        if (!$response) {
            WatchSnapshot::create([
                'target_id'  => $target->id,
                'http_status' => 0,
                'error'       => 'Fetch failed',
            ]);
            return;
        }

        // Parse
        $extracted = $extractor->extract($response->body(), $target);
        $httpStatus = $response->status();

        WatchSnapshot::create([
            'target_id'      => $target->id,
            'price'          => $extracted?->price,
            'in_stock'       => $extracted?->inStock,
            'raw_price_text' => $extracted?->rawText,
            'http_status'    => $httpStatus,
        ]);

        // Compare and alert
        if ($extracted && $target->last_price) {
            $changePct = abs($extracted->price - $target->last_price) / $target->last_price * 100;

            if ($changePct >= $target->alert_threshold_pct) {
                $alerts->priceChanged($target, $target->last_price, $extracted->price);
            }
        }

        if ($extracted && $target->last_in_stock !== null && $extracted->inStock !== $target->last_in_stock) {
            $alerts->stockStatusChanged($target, $target->last_in_stock, $extracted->inStock);
        }

        $target->update([
            'last_checked_at' => now(),
            'last_price'      => $extracted?->price ?? $target->last_price,
            'last_in_stock'   => $extracted?->inStock ?? $target->last_in_stock,
        ]);
    }
}

Диспетчер расписания проверок

class WatchScheduler
{
    public function dispatch(): void
    {
        WatchTarget::active()
            ->where(function ($q) {
                $q->whereNull('last_checked_at')
                  ->orWhereRaw("last_checked_at + check_interval < NOW()");
            })
            ->orderBy('last_checked_at')
            ->chunk(200, function ($targets) {
                foreach ($targets as $target) {
                    CheckWatchTargetJob::dispatch($target->id)
                        ->onQueue('monitoring');
                }
            });
    }
}

Интерфейс управления мониторингом

В административной панели:

  • Список URL с текущей ценой и временем последней проверки
  • Кнопка «Проверить сейчас»
  • График изменений цены за 30 дней
  • Настройка порога уведомления для каждого URL
  • Массовое добавление URL из CSV

Паттерны уведомлений

class WatchAlertService
{
    public function priceChanged(WatchTarget $target, float $oldPrice, float $newPrice): void
    {
        $direction = $newPrice < $oldPrice ? '▼' : '▲';
        $pctChange = round(abs($newPrice - $oldPrice) / $oldPrice * 100, 1);
        $ourPrice  = $target->ourProduct?->price;

        $text = "{$direction} *Изменение цены* на {$target->site->name}\n"
            . "{$target->label}\n"
            . "Было: " . number_format($oldPrice, 0, '.', ' ') . " руб.\n"
            . "Стало: " . number_format($newPrice, 0, '.', ' ') . " руб. ({$pctChange}%)\n";

        if ($ourPrice) {
            $diff = round(($newPrice - $ourPrice) / $ourPrice * 100, 1);
            $text .= "Наша цена: " . number_format($ourPrice, 0, '.', ' ') . " руб. "
                . ($diff > 0 ? "(мы дешевле на {$diff}%)" : "(они дешевле на " . abs($diff) . "%)") . "\n";
        }

        $text .= "\n[Открыть страницу]({$target->url})";

        $this->telegram->sendMessage([
            'chat_id'    => config('telegram.price_watch_chat'),
            'text'       => $text,
            'parse_mode' => 'Markdown',
        ]);
    }
}

Сроки реализации

  • Схема данных + FlexiblePriceExtractor + LD-JSON: 1–2 дня
  • CheckWatchTargetJob + диспетчер: 0.5 дня
  • Telegram-уведомления: 0.5 дня
  • Интерфейс управления + графики: 1 день
  • Playwright-адаптер для JS-сайтов: +1 день

Итого: 3–4 рабочих дня.