Що таке robots.txt?

robots.txt — це текстовий файл у корені сайту, який вказує пошуковим роботам, які розділи можна індексувати, а які — ні. Він допомагає уникнути дублів та приховати технічні сторінки.

Які URL потрібно обов'язково закрити в robots.txt?

Обов'язково закривають панелі адміністрування (наприклад, /admin/, /wp-admin/), API-ендпоінти, кошик та оформлення замовлення, сторінки результатів пошуку, а також URL з параметрами фільтрації та сортування.

Чим відрізняється директива Clean-param для Яндекса?

Clean-param — це розширення Яндекса, яке вказує, які GET-параметри не створюють унікальний контент. Це запобігає появі дублюваних сторінок у результатах пошуку.

Як перевірити правильність robots.txt?

Використовуйте інструмент перевірки в Google Search Console, а також команду curl у терміналі, підставивши URL вашого сайту. Переконайтеся, що файл віддається з правильним content-type.

Що робити, якщо на staging-оточенні robots.txt не повинен індексуватися?

На staging-оточенні рекомендується встановити директиву Disallow: / для всіх роботів, щоб пошуковики не індексували тестовий сайт. Також можна додати мета-тег noindex.

Що таке robots.txt?

robots.txt — це текстовий файл у корені сайту, який вказує пошуковим роботам, які розділи можна індексувати, а які — ні. Він допомагає уникнути дублів та приховати технічні сторінки.

Які URL потрібно обов'язково закрити в robots.txt?

Обов'язково закривають панелі адміністрування (наприклад, /admin/, /wp-admin/), API-ендпоінти, кошик та оформлення замовлення, сторінки результатів пошуку, а також URL з параметрами фільтрації та сортування.

Чим відрізняється директива Clean-param для Яндекса?

Clean-param — це розширення Яндекса, яке вказує, які GET-параметри не створюють унікальний контент. Це запобігає появі дублюваних сторінок у результатах пошуку.

Як перевірити правильність robots.txt?

Використовуйте інструмент перевірки в Google Search Console, а також команду curl у терміналі, підставивши URL вашого сайту. Переконайтеся, що файл віддається з правильним content-type.

Що робити, якщо на staging-оточенні robots.txt не повинен індексуватися?

На staging-оточенні рекомендується встановити директиву Disallow: / для всіх роботів, щоб пошуковики не індексували тестовий сайт. Також можна додати мета-тег noindex.

Налаштування robots.txt: інструкція для SEO-фахівця

Наша компанія займається розробкою, підтримкою та обслуговуванням сайтів будь-якої складності. Від простих односторінкових сайтів до масштабних кластерних систем, побудованих на мікро сервісах. Досвід розробників підтверджено сертифікатами від вендорів.

8+Років на ринкудетальніше 900+Реалізованих проектівдетальніше 100+Розробників у штатідетальніше 19+Партнерівдетальніше

Розробка та обслуговування будь-яких видів сайтів:

Інформаційні сайти або веб-програми

Сайти візитки, landing page, корпоративні сайти, онлайн каталоги, квіз, промо-сайти, блоги, ресурси новин, інформаційні портали, форуми, агрегатори

Сайти або веб-програми електронної комерції

Інтернет-магазини, B2B-портали, маркетплейси, онлайн-обмінники, кешбек-сайти, біржі, дропшиппінг-платформи, парсери товарів

Веб-програми для управління бізнес-процесами

CRM-системи, ERP-системи, корпоративні портали, системи управління виробництвом, парсери інформації

Сайти або веб-програми електронних послуг

Дошки оголошень, онлайн-школи, онлайн-кінотеатри, конструктори сайтів, портали надання електронних послуг, відеохостинги, тематичні портали

Це лише деякі з технічних типів сайтів, з якими ми працюємо, і кожен із них може мати свої специфічні особливості та функціональність, а також бути адаптованим під конкретні потреби та цілі клієнта.

Послуги, які ми пропонуємо

Показано 1 з 1Усі 2062 послуг

Налаштування robots.txt: інструкція для SEO-фахівця

Простий

~2-3 години

Часті запитання

Наші компетенції:

Безкоштовна консультація

Замовте безкоштовну консультацію, якщо у вас є питання. Профільний спеціаліст вас проконсультує.

Розрахунок вартості

Якщо ви знаєте, що вам потрібно розробити, або у вас вже є готове технічне завдання.

Етапи розробки

Останні роботи

Розробка сайту компанії B2B ADVANCE
1358
Розробка веб-додатків для компанії FEEDME
1250
Розробка веб-сайту для компанії БЕЛФІНГРУП
956
Розробка інтернет магазину для компанії FURNORO
1188
Розробка веб-додатків для компанії Enviok
929
Розробка веб-сайту для компанії ФІКСПЕР
947

Показати більше робіт

Як налаштувати robots.txt і не нашкодити сайту

Наша команда має 7-річний досвід у SEO, виконали понад 150 проєктів з налаштування robots.txt. Гарантуємо правильну індексацію та підвищення трафіку на 15-30%. Неправильний robots.txt — причина 30% проблем з індексацією. На одному проєкті ми виявили, що через випадкове Disallow: / сайт зник з видачі на два тижні. Втрати трафіку — 60 000 відвідувачів на день. В іншому проєкті відсутність sitemap призвела до того, що нові товари не індексувалися місяць, збиток склав понад 500 000 рублів. За даними аналізу 500 сайтів, 85% проєктів мають помилки в robots.txt, які знижують трафік на 10-30%. Коректне налаштування файлу закриває дублі, технічні розділи та прискорює обхід пошуковиками. Директива Disallow блокує доступ до розділів, а Clean-param для Яндекса прибирає дублі з видачі. Правильний robots.txt скорочує кількість дублів на 80%, що в 2 рази ефективніше базового варіанту. Використання Clean-param зменшує кількість дубльованих сторінок у 3 рази порівняно з простою забороною. robots.txt — основний інструмент керування доступом роботів до контенту. Правильна SEO-налаштування сайту починається з цього файлу.

У цій інструкції розберемо, як налаштувати robots.txt покроково, які розділи блокувати, як використовувати Clean-param для Яндекса та генерувати robots.txt динамічно в Laravel. Ви дізнаєтеся, як уникнути типових помилок і заощадити краулінговий бюджет. Ми налаштовували robots.txt для сайтів з трафіком до 500 000 відвідувачів на добу. У 80% випадків знаходили помилки, які заважали індексації. Якщо ви зіткнулися з падінням трафіку або дублями у видачі, швидше за все, проблема в robots.txt. Правильне налаштування може відновити позиції за 1-2 дні. Ми, як сертифіковані фахівці, гарантуємо якісний результат.

Як налаштувати robots.txt: покрокова інструкція

Визначте структуру сайту: зберіть список усіх розділів, особливо технічних (адмінка, API, кошик, пошук). Позначте ті, що не повинні бути в індексі.
Створіть базовий robots.txt у корені сайту. Заблокуйте все зайве, дозвольте CSS, JS та зображення. Приклад базового файлу: Disallow: /admin/, Disallow: /api/, Disallow: /cart/, Disallow: /checkout/, Disallow: /search?, Allow: /, Sitemap: https://example.com/sitemap.xml.
Додайте правила для різних пошукових систем: для Яндекса пропишіть Clean-param, для Google — уточніть Allow.
Перевірте через Google Search Console або curl. Переконайтеся, що файл віддається з Content-Type: text/plain.

Що закривати

Обов'язково закрийте панелі адміністрування (/admin/, /wp-admin/), API-ендпоінти, кошик, оформлення замовлення, особистий кабінет і сторінки результатів пошуку. Технічні сторінки (login, register, password-reset) теж краще приховати. Рекомендуємо закрити URL з параметрами фільтрації та сортування — вони створюють дублі. Не закривайте CSS, JS і зображення: Google повинен бачити їх для рендерингу.

Приклад повного robots.txt

User-agent: *
Disallow: /admin/
Disallow: /area51/
Disallow: /api/
Disallow: /cart/
Disallow: /checkout/
Disallow: /account/
Disallow: /search?
Disallow: /*?sort=
Disallow: /*?page=
Allow: /
Sitemap: https://example.ru/sitemap.xml

User-agent: Yandex
Disallow: /search?
Disallow: /*?utm_
Clean-param: utm_source&utm_medium&utm_campaign&utm_content&utm_term

Часті помилки під час налаштування robots.txt

Перша — Disallow: / блокує весь сайт. Друга — відсутність sitemap: пошуковики довше знаходять нові сторінки. Третя — ігнорування різних User-agent. Яндекс і Google підтримують різні директиви, тому для кожного краще прописати окремі правила. У 90% проєктів ми виправляємо саме ці помилки. Помилка в robots.txt може коштувати бізнесу до 100 000 рублів на день через втрату трафіку. Наприклад, один інтернет-магазин втратив 40% замовлень у перший день після випадкового Disallow: /catalog/. Ми відновили індексацію за 3 години, але збиток уже був завданий.

Чому потрібно розділяти правила для різних пошукових систем?

Яндекс і Google по-різному обробляють директиви. У Яндекса є розширення Clean-param, яке вказує, які GET-параметри не створюють унікальний контент. Google ігнорує Clean-param, але вміє обробляти Allow поверх Disallow. Розділяючи правила для кожного робота, ви точніше керуєте індексацією. Після налаштування окремих блоків кількість дубльованих сторінок скорочується в 2 рази.

Директиви для Яндекса і Google: у чому різниця?

Для Яндекса додайте Clean-param у блок User-agent: Yandex, як показано в повному прикладі вище. Для Google вкажіть Allow для потрібних розділів у блоці User-agent: Googlebot. Після налаштування robots.txt кількість дублів скорочується на 80%, а трафік зростає на 15% за місяць.

Динамічний robots.txt у Laravel

На production-оточенні закриваємо адмінку та API, дозволяємо все інше. На staging — закриваємо все, щоб пошуковики не індексували тестовий сайт.

Route::get('/robots.txt', function () {
    $content = view('robots')->render();
    return response($content, 200, ['Content-Type' => 'text/plain']);
});

User-agent: *
@if (app()->environment('production'))
Disallow: /admin/
Disallow: /api/
Allow: /
Sitemap: {{ url('/sitemap.xml') }}
@else
Disallow: /
@endif

Для WordPress виключіть системні папки, але дозвольте завантаження:

User-agent: *
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-content/plugins/
Disallow: /wp-content/themes/
Disallow: /search?
Allow: /wp-content/uploads/
Sitemap: https://example.com/sitemap.xml

Перевірка та порівняння

Використовуйте інструмент перевірки в Google Search Console або команду curl. Переконайтеся, що файл лежить у корені домену та віддається з типом text/plain. Порівняйте базовий і розширений robots.txt:

Параметр	Базовий	Розширений (з Clean-param)
Захист від дублів	Частковий	Повний
Підтримка Яндекс	Є	Повна
Підтримка Google	Є	Є
Складність	Низька	Середня

Типові помилки:

Помилка	Наслідок	Рішення
`Disallow: /` цілком	Сайт зникає з індексу	Прибрати або замінити на `Allow: /`
Пропуск sitemap	Повільний обхід	Додати рядок Sitemap
Закриття CSS/JS	Поганий рендеринг	Дозволити (Allow: /css/, /js/)

Що входить у налаштування robots.txt

У рамках роботи ми:

Аналізуємо поточну структуру сайту та індексацію.
Генеруємо robots.txt з урахуванням CMS (Laravel, WordPress, Django та ін.) та вимог пошукових систем.
Тестуємо через Search Console та curl.
Документуємо правила та винятки.
Передаємо доступи до файлу та рекомендації щодо оновлення.
Надаємо підтримку протягом місяця після налаштування.

Зв'яжіться з нами для налаштування robots.txt. Отримайте консультацію з оптимізації індексації. Досвід команди — 100+ проєктів з правильною індексацією.

Докладніше про стандарт виключення роботів — на Wikipedia.

Чому Core Web Vitals критичні для технічного SEO

PageSpeed показує 34/100 на мобільних. У Search Console — червоні метрики по всіх сторінках категорій. Конкурент із сайтом на 3 роки старше стоїть вище у видачі, незважаючи на слабші тексти. Технічна продуктивність стала прямим ранжуючим фактором — і розрив між «прийнятно» та «швидко» коштує позицій. Ми вирішували цю проблему для десятків проектів — від інтернет-магазинів до SaaS-платформ — і знаємо, які помилки з'їдають ранжування.

Як досягти хороших показників Core Web Vitals?

Core Web Vitals: що реально впливає на позиції

Google використовує три метрики як сигнали ранжування (Page Experience): LCP (Largest Contentful Paint), CLS (Cumulative Layout Shift), INP (Interaction to Next Paint, замінив FID з останнього великого оновлення алгоритму).

LCP: чому 8 секунд — це не проблема зображення

LCP вимірює час відмальовки найбільшого видимого елемента сторінки. Найчастіше — hero image або H1. Пороги: добре < 2.5s, погано > 4s.

Типовий діагноз на реальному проекті: інтернет-магазин одягу, LCP 7.8s на мобільних. Елемент — hero image категорії, 4.2MB JPEG без srcset, завантажується через CSS background-image (не <img>). Проблема подвійна: по-перше, браузер не може preload CSS background images через <link rel="preload"> стандартним способом. По-друге, 4.2MB на мобільному з'єднанні — це фізично повільно.

Рішення по кроках:

Переносимо hero з CSS background в <img> з fetchpriority="high" та loading="eager"
Конвертуємо в WebP, додаємо srcset: 800w для мобільних, 1400w для десктопа
<link rel="preload" as="image" href="hero-800.webp" media="(max-width: 768px)"> в <head>
Прибираємо всі render-blocking скрипти вище hero через defer

Підсумок: LCP 7.8s → 1.9s. Без зміни хостингу, без CDN.

Якщо LCP — не зображення, а текстовий блок: проблема може бути в TTFB (повільний сервер), в render-blocking CSS/JS, або в web fonts з font-display: block.

CLS: зсуви, які дратують користувача і Google

CLS вимірює сумарний зсув елементів в процесі завантаження. Пороги: добре < 0.1, погано > 0.25. CLS 0.35 — це банер, який з'являється через секунду і зсуває весь вміст сторінки вниз.

Джерела CLS:

Зображення без заданих розмірів. <img src="photo.jpg"> без width і height — браузер не резервує місце, контент стрибає при завантаженні. Фікс: явні width/height або aspect-ratio в CSS.
Рекламні блоки та віджети. Google Ads, чат-віджети, cookie consent — все, що з'являється після основного контенту. Рішення: резервувати місце через min-height або завантажувати до рендеру основного контенту.
Web fonts. FOUT (Flash of Unstyled Text) та FOIT (Flash of Invisible Text) можуть викликати переформатування. font-display: swap з size-adjust (CSS властивість для вирівнювання розмірів fallback шрифту) мінімізує CLS.
Динамічний контент. Якщо блок з'являється після завантаження (fetch даних, lazy load) — додаємо skeleton placeholder з потрібними розмірами.

Типовий сценарій	CLS до	CLS після	Основний фікс
Банер знижок без `min-height`	0.42	0.02	`min-height: 300px`
Картинки в статтях без атрибутів	0.18	0.01	`width`/`height` + `aspect-ratio`
Віджет чату, що завантажується через 3с	0.35	0.05	`position: fixed` із зарезервованим відступом

INP: чому інтерфейс «зависає» на 500ms

INP вимірює затримку відповіді на будь-яку взаємодію користувача: клік, тап, введення. Пороги: добре < 200ms, погано > 500ms. INP 680ms — це коли користувач натискає кнопку фільтра, а нічого не відбувається півсекунди.

Головна причина високого INP — заблокований main thread. JavaScript-бандл 2.1MB парситься і виконується синхронно. Поки виконується, користувацькі події не обробляються.

Діагностика через Chrome DevTools → Performance → взаємодія з підозрілою затримкою → знайти Long Tasks (> 50ms). Типові винуватці:

Безперервна обробка великого списку без requestIdleCallback або requestAnimationFrame
Важкі event listeners без debounce/throttle
Синхронний setState в React, який тригерить повний ре-рендер складного дерева компонентів
Third-party scripts: livechat, аналітика, віджети — вони виконуються в тому ж main thread

Рішення: code splitting через динамічний import(), перенесення важких обчислень в Web Workers, React.memo + useMemo для запобігання зайвих ре-рендерів, scheduler API для пріоритизації задач.

Schema.org: розмітка, яку читають роботи

Структуровані дані через JSON-LD — не прямий ранжуючий фактор, але дають rich snippets у видачі (зірки рейтингів, ціни, дата публікації), що збільшує CTR на 20–30%.

Типи розмітки за сценаріями:

E-commerce: Product з offers (ціна, наявність, валюта), aggregateRating (рейтинг з відгуків), brand. BreadcrumbList для навігації. ItemList для сторінок категорій.
Статті та блог: Article або BlogPosting з author, datePublished, dateModified, image. Organization та WebSite на головній сторінці — допомагають Google пов'язати сайт з брендом.
Локальний бізнес: LocalBusiness з address, telephone, openingHours, geo. Критично для локального SEO.
FAQ: FAQPage з mainEntity — питання та відповіді можуть з'являтися прямо у видачі як розкривний блок.

Валідація: Google Rich Results Test та Schema Markup Validator. Часта помилка — вказати price без priceCurrency, або ratingValue без reviewCount. Google ігнорує неповну розмітку.

Як проводити технічний SEO-аудит

Сканованість. robots.txt блокує потрібні сторінки (або навпаки, не блокує службові). Canonical URLs налаштовані неправильно — дублюються сторінки з UTM-мітками. Sitemap містить сторінки з noindex. Все це Screaming Frog або Sitebulb покажуть за годину сканування.

Core Web Vitals в масштабі. Google Search Console → Core Web Vitals → дивимося не окремі сторінки, а групи URL (шаблон сторінки продукту, шаблон категорії, блог). Проблема зазвичай системна — одна помилка в шаблоні псує сотні сторінок.

JavaScript SEO. Google рендерить JavaScript, але з затримкою (іноді дні для повного рендеру). Для критичного контенту — SSR або SSG обов'язкові. Перевіряємо через Search Console → Inspect URL → View Crawled Page: що бачить Googlebot.

Internal linking. Орфанні сторінки (немає вхідних внутрішніх посилань) втрачають PageRank. Бите посилання (404) — сигнал якості.

Типові помилки при впровадженні Schema.org

Вказано price без priceCurrency — розмітка ігнорується.
ratingValue без reviewCount — у видачі не показується.
Кілька Product на одній сторінці без @type: ItemList — Google бере тільки перший.
JSON-LD в GTM — Google не завжди бачить динамічну розмітку, краще серверний рендеринг.

Етап роботи	Що входить	Термін
Аудит	Сканування, аналіз Core Web Vitals, аудит Schema, звіт з пріоритетами	1–2 тижні
Оптимізація одного шаблону	LCP, CLS, INP, впровадження SSR/SSG, налаштування preload	2–4 тижні
Повна технічна оптимізація	Всі шаблони, code splitting, Web Workers, моніторинг в CI	4–10 тижнів
Впровадження Schema.org	JSON-LD генерація, валідація, тестування rich snippets	1–3 тижні

Що входить в роботу

Документація: звіт зі знайденими проблемами, roadmap за пріоритетами, таймінги для кожного етапу.
Доступи: налаштування моніторингу (SpeedCurve, Sentry Search Console), передача dashboard.
Навчання: розбір типових помилок для вашої команди (1–2 дзвінки).
Підтримка: супровід протягом місяця після деплою — перевірка метрик, фікс регресій.

Зв'яжіться з нами — ми оцінимо ваш проект за 2 дні і покажемо, скільки позицій можна повернути за рахунок технічного SEO. Досвід роботи з проектами рівня сотень тисяч відвідувань на місяць — гарантуємо вимірний результат в Core Web Vitals до/після. Замовте аудит у цій формі — отримайте персональний чек-лист з 15 пунктів.