Налаштування сканування сайту через Screaming Frog
Screaming Frog SEO Spider — десктопний краулер, де-факто стандарт технічного SEO-аудиту. Умеет сканувати сотні тисяч URL, перевіряє редиректи, дублі, розірвані посилання, мета-теги, структуру заголовків, hreflang, canonical, sitemap, robots.txt.
Установка та ліцензія
Screaming Frog розповсюджується як Java-додаток. Безплатна версія обмежена 500 URL. Реальні проекти потребують платної ліцензії (~$259 на рік).
Запуск через CLI
Ключове для автоматизації — режим headless:
screamingfrogseospider \
--crawl https://example.com \
--headless \
--save-crawl \
--export-tabs "Internal:All,Response Codes:All" \
--output-folder /var/reports/
Конфігурація через файл настроєк
Збережіть стандартизований конфіг та передавайте при запуску для повторюваності.
Аутентифікація для закритих розділів
Використовуйте cookie-аутентифікацію або HTTP Basic Auth для захищених областей.
Обробка результатів
Screaming Frog експортує окремий CSV для кожної вкладки. Обробляйте з pandas для аналізу та звітування.
Автоматичний еженедельний аудит
Налаштуйте cron-завдання для щотижневих краулінгів з автоматичною обробкою результатів та алертами.
Потреба в ресурсах
RAM-вимоглива програма. Без JS: 1–2 GB. З рендерингом: 4–8 GB. Встановіть heap JVM явно.
Швидкість краулінгу: без JS 5–20 сторінок/сек, з JS 1–3 сторінки/сек.
Сроки
Налаштування регулярного CLI-краулінгу з обробкою результатів та алертами — 2–3 робочих дні.







