Скільки шардів має бути в індексі Elasticsearch?

Оптимальний розмір одного шарда — 10–50 ГБ. Для розрахунку кількості шардів розділіть очікуваний об'єм даних на 30 ГБ. Наприклад, для 300 ГБ даних потрібно 10 шардів. Також враховуйте ліміт: не більше 20 шардів на 1 ГБ купи JVM.

Як refresh_interval впливає на швидкість індексації?

За замовчуванням refresh_interval = 1с, що дає високе навантаження на IO. При відключенні refresh на час bulk-завантаження швидкість зростає в 3–5 разів. Для real-time пошуку залишайте 1с, для аналітики — 30–300с.

Чи варто використовувати forcemerge на активних індексах?

Ні. Forcemerge створює інтенсивне IO-навантаження та блокує індексацію. Його застосовують тільки для read-only індексів (архіви, завершені rolling-індекси). Після forcemerge пошук прискорюється, а розмір індексу зменшується на 20–40%.

Як зменшити кількість шардів у існуючому індексі?

Використовуйте Shrink API: відключіть запис, перемістіть усі шарди на один вузол, виконайте _shrink з новою кількістю шардів. Процес вимагає вільного місця та часу, але безпечний, якщо слідувати документації.

Чому мій кластер ES гальмує при 30% завантаження CPU?

Часто причина — неправильна конфігурація GC або перевантажена купа. При heap > 85% вмикається агресивний G1GC, падає throughput. Перевірте логи на GCOverheadLimit, налаштуйте jvm.options для G1GC. Також можлива проблема з повільними дисками.

Скільки шардів має бути в індексі Elasticsearch?

Оптимальний розмір одного шарда — 10–50 ГБ. Для розрахунку кількості шардів розділіть очікуваний об'єм даних на 30 ГБ. Наприклад, для 300 ГБ даних потрібно 10 шардів. Також враховуйте ліміт: не більше 20 шардів на 1 ГБ купи JVM.

Як refresh_interval впливає на швидкість індексації?

За замовчуванням refresh_interval = 1с, що дає високе навантаження на IO. При відключенні refresh на час bulk-завантаження швидкість зростає в 3–5 разів. Для real-time пошуку залишайте 1с, для аналітики — 30–300с.

Чи варто використовувати forcemerge на активних індексах?

Ні. Forcemerge створює інтенсивне IO-навантаження та блокує індексацію. Його застосовують тільки для read-only індексів (архіви, завершені rolling-індекси). Після forcemerge пошук прискорюється, а розмір індексу зменшується на 20–40%.

Як зменшити кількість шардів у існуючому індексі?

Використовуйте Shrink API: відключіть запис, перемістіть усі шарди на один вузол, виконайте _shrink з новою кількістю шардів. Процес вимагає вільного місця та часу, але безпечний, якщо слідувати документації.

Чому мій кластер ES гальмує при 30% завантаження CPU?

Часто причина — неправильна конфігурація GC або перевантажена купа. При heap > 85% вмикається агресивний G1GC, падає throughput. Перевірте логи на GCOverheadLimit, налаштуйте jvm.options для G1GC. Також можлива проблема з повільними дисками.

Оптимізація Elasticsearch: шарди, refresh_interval, запити

Наша компанія займається розробкою, підтримкою та обслуговуванням сайтів будь-якої складності. Від простих односторінкових сайтів до масштабних кластерних систем, побудованих на мікро сервісах. Досвід розробників підтверджено сертифікатами від вендорів.

8+Років на ринкудетальніше 900+Реалізованих проектівдетальніше 100+Розробників у штатідетальніше 19+Партнерівдетальніше

Розробка та обслуговування будь-яких видів сайтів:

Інформаційні сайти або веб-програми

Сайти візитки, landing page, корпоративні сайти, онлайн каталоги, квіз, промо-сайти, блоги, ресурси новин, інформаційні портали, форуми, агрегатори

Сайти або веб-програми електронної комерції

Інтернет-магазини, B2B-портали, маркетплейси, онлайн-обмінники, кешбек-сайти, біржі, дропшиппінг-платформи, парсери товарів

Веб-програми для управління бізнес-процесами

CRM-системи, ERP-системи, корпоративні портали, системи управління виробництвом, парсери інформації

Сайти або веб-програми електронних послуг

Дошки оголошень, онлайн-школи, онлайн-кінотеатри, конструктори сайтів, портали надання електронних послуг, відеохостинги, тематичні портали

Це лише деякі з технічних типів сайтів, з якими ми працюємо, і кожен із них може мати свої специфічні особливості та функціональність, а також бути адаптованим під конкретні потреби та цілі клієнта.

Послуги, які ми пропонуємо

Показано 1 з 1Усі 2062 послуг

Оптимізація Elasticsearch: шарди, refresh_interval, запити

Складний

~2-3 дні

Часті запитання

Наші компетенції:

Безкоштовна консультація

Замовте безкоштовну консультацію, якщо у вас є питання. Профільний спеціаліст вас проконсультує.

Розрахунок вартості

Якщо ви знаєте, що вам потрібно розробити, або у вас вже є готове технічне завдання.

Етапи розробки

Останні роботи

Розробка сайту компанії B2B ADVANCE
1360
Розробка веб-додатків для компанії FEEDME
1251
Розробка веб-сайту для компанії БЕЛФІНГРУП
957
Розробка інтернет магазину для компанії FURNORO
1188
Розробка веб-додатків для компанії Enviok
929
Розробка веб-сайту для компанії ФІКСПЕР
947

Показати більше робіт

Повільний Elasticsearch — майже завжди результат неправильних налаштувань, а не нестачі заліза. Зайві шарди вбивають продуктивність надійніше, ніж слабкі процесори. Занадто частий refresh робить індексацію в 3–5 разів повільнішою, ніж потрібно. Ми займаємося оптимізацією Elasticsearch для наших клієнтів уже понад 5 років — на нашому досвіді 90% проблем вирішуються налаштуваннями, а не апгрейдом серверів. Оптимізація Elasticsearch — це насамперед правильне проектування, а потім уже тюнінг заліза.

Як правильно налаштувати кількість шардів?

Кожен шард — це окремий екземпляр Lucene індексу зі своїми файловими дескрипторами, JVM об'єктами, overhead на heap. На кластері з 5 вузлами тримати 500 маленьких індексів по 50 шардів кожен = 25 000 шардів = кластер ледве повзає. Правило: 1 шард = 10–50 GB даних. Менше — шарди занадто маленькі (overhead домінує над даними). Більше — шард складно перебалансувати при додаванні вузла. Максимум шардів на 1 GB heap: ~20 шардів. При heap 16 GB = не більше 320 шардів на вузол.

Перевірити статистику шардів можна командами _cat/shards та _cat/nodes. Зменшення числа шардів через Shrink API вимагає відключення запису та переміщення всіх шардів на один вузол, потім виконується _shrink.

Чому refresh_interval такий важливий?

Elasticsearch за замовчуванням робить refresh кожну секунду — створює новий сегмент Lucene з буфера в пам'яті та робить документи доступними для пошуку. Кожен refresh — файлові операції, створення сегмента, навантаження на IO. Для real-time пошуку (чат, сповіщення) залишайте 1s. Для аналітики, логів, ETL збільште до 30s–300s. При bulk-завантаженні даних відключайте refresh на час: "index.refresh_interval": "-1". Приріст швидкості індексації — 3–5x.

Merge Policy та forcemerge

Lucene періодично об'єднує дрібні сегменти у великі (merge). Це звільняє місце від видалених документів та прискорює пошук. Для read-only індексів (архівні дані, завершені rolling-індекси) форсувати merge до 1 сегмента:

POST /logs-archive-01/_forcemerge?max_num_segments=1

Після forcemerge пошук значно швидший, а розмір зменшується на 20–40% за рахунок видалення tombstone-записів. Не запускайте forcemerge на активно індексованих індексах — створює величезне IO навантаження.

Репліки та Bulk API

Репліка — синхронна копія шарда на іншому вузлі. При bulk-завантаженні даних у новий індекс тимчасово відключайте репліки: "index.number_of_replicas": 0. Приріст швидкості — 2–3x при 1 репліці, 3–4x при 2 репліках. Bulk API — антипатерн індексувати по одному документу. Використовуйте паралельне завантаження з розміром пакета 5–15 MB. Приклад на Python з parallel_bulk:

from elasticsearch import Elasticsearch
from elasticsearch.helpers import parallel_bulk

es = Elasticsearch([...])

def generate_actions(data):
    for item in data:
        yield {"_index": "products", "_source": item}

for ok, info in parallel_bulk(es, generate_actions(data), chunk_size=500, max_chunk_bytes=10*1024*1024):
    if not ok:
        print(info)

Оптимізація запитів

Filter vs. Query: використовуйте filter усюди, де не потрібен score. Фільтри кешуються на рівні шарда. Wildcard та regexp — дорогі операції, особливо з leading wildcard. Замінюйте на edge N-gram. Deep pagination: from: 10000 — дорого. Використовуйте search_after з сортуванням.

Моніторинг та GC

Profile API — детальний розбір виконання запиту. Hot Threads API — що робить JVM. При heap > 85% вмикається агресивний G1GC, запити гальмують. Налаштуйте jvm.options для G1GC: -XX:+UseG1GC, -XX:G1ReservePercent=25, -XX:InitiatingHeapOccupancyPercent=30.

Що входить в аудит та оптимізацію під ключ за 5 днів

Аналіз поточної конфігурації кластера (шарди, репліки, refresh_interval, merge policy)
Навантажувальне тестування з профілюванням запитів
Рекомендації щодо шардингу та налаштування refresh_interval
Оптимізація запитів із використанням filter, search_after
Налаштування G1GC та heap
Документація змін та подальша підтримка

Параметр	Рекомендація	Коментар
Розмір шарда	10–50 GB	Менше — overhead, більше — складно балансувати
Шардів на 1GB heap	≤20	16GB heap → не більше 320 шардів на вузол
refresh_interval	1s (real-time) / 30-300s (аналітика) / -1 (bulk)	Відключення refresh прискорює індексацію в 3-5x
Репліки	1 (HA) / 0 (bulk)	При завантаженні відключати репліки
Forcemerge	Тільки для read-only індексів	Зменшує розмір на 20-40%

Типові терміни

- Аудит конфігурації: 1 день (від 200$) - Оптимізація шардингу та refresh: 2–3 дні - Глибока оптимізація запитів: 1–2 дні

Пишіть нам для оцінки вашого кластера — наші сертифіковані інженери з 5+ років досвіду гарантують прискорення пошуку в 2-5 разів. Замовте аудит продуктивності Elasticsearch та отримайте детальний звіт з рекомендаціями. Економія на інфраструктурі може сягати 30% (від 500$ на місяць). Вартість аудиту від 200$, а повна оптимізація під ключ — від 1000$ за 5 днів.

Elasticsearch Documentation — офіційний посібник із налаштування продуктивності.

Послуги бекенд-розробки: production-grade надійність

На production-сервері о 3:14 ночі черга Laravel Jobs перестала оброблятися — 40 000 необроблених завдань у Redis. Причина: worker упав через memory leak у статичній змінній Eloquent observer, supervisor не перезапустив через misconfigured stopwaitsecs. Ми розбирали такий інцидент на проекті з 500 RPS: діагностика 4 години, фікс — 20 хвилин. Щоб ви не втрачали гроші, пропонуємо послуги бекенд-розробки з акцентом на production-grade надійність — 10+ років досвіду, 50+ проектів, 5 років на ринку. Оцінимо ваш проект за 2 дні.

Які проблеми вирішуємо

N+1 запити: головний вбивця швидкості

N+1 — найпоширеніша причина повільних сторінок у Laravel-додатках. Стандартна історія: сторінка працювала нормально на dev з 10 записами, на production з 10 000 — 8-секундне завантаження.

Laravel Debugbar у dev-оточенні показує кількість запитів. Більше 20 — сигнал для audit.

Model::preventLazyLoading(! app()->isProduction());

Telescope для профілювання: логує всі запити, jobs, mail, notifications з деталізацією. Після впровадження eager loading час завантаження сторінки падає з 8 с до 0.3 с — у 27 разів.

Memory leak у статичних змінних

У Laravel Octane або Swoole додаток тримається в пам’яті між запитами. Статичні змінні не скидаються — призводять до неконтрольованого росту пам’яті. Використовуємо defer-функції та контейнерні біндинги для коректного скидання стану.

Неправильний connection pool

Rails, Laravel, Django відкривають нове з'єднання PostgreSQL на кожен PHP/Python процес. 100 воркерів — 100 з'єднань. PostgreSQL деградує від 200+ активних з'єднань через overhead на управління.

PgBouncer у transaction pooling: 1000 воркерів → 20–50 реальних з'єднань. Це знижує latency на 40% та зменшує витрати на хостинг на 30% — при середній вартості хостингу $2,000/міс економить $600/міс. GIN-індекс для JSONB до 100 разів швидший за B-tree при пошуку.

Як Octane справляється з високим навантаженням?

Laravel Octane (RoadRunner або Swoole) прибирає overhead bootstrap на кожен HTTP-запит. Приріст: 3–8x на синтетичних бенчмарках, 2–4x на реальних додатках. Важливо: не зберігати стан у статичних змінних — застосовуємо це на проектах >1000 RPS.

Як PostgreSQL допомагає уникнути повільних запитів?

Використовуємо composite indexes для WHERE + ORDER BY, partial indexes для фільтрів з високою селективністю, GIN-індекси для JSONB та full-text search. to_tsvector + GIN замість LIKE '%query%' — запобігає seq scan навіть на мільйонах записів. Аналізуємо плани через EXPLAIN ANALYZE та pg_stat_statements.

Як обрати стек для вашого проекту?

Стек	Коли використовувати
Laravel + Octane	CRUD, бізнес-логіка, REST/GraphQL API, адмінки
Node.js (Fastify)	Realtime WebSocket, streaming, serverless, висока I/O concurrency
Go	Високонавантажені мікросервіси (>10k RPS), gRPC, DevOps-інструменти
Django + DRF	ML-пайплайни, інтеграція з AI, складна обробка даних
Ruby on Rails	Швидкий MVP з багатим екосистемою гемів

Node.js виправданий для realtime: Laravel публікує події в Redis Pub/Sub, Node.js підписується та транслює клієнтам. Go — для goroutines (10k з'єднань на сервер — норма), але розробка повільніша, ніж Laravel.

Чому Redis критичний для продуктивності?

Redis виконує кілька ролей:

Роль	Деталі
Кеш	Кешування результатів важких запитів, фрагментів HTML
Черги	Backend для Laravel Queue / Celery
Session store	Distributed sessions в multi-instance оточенні
Pub/Sub	Realtime події між сервісами
Rate limiting	Sliding window counters для API throttling
Leaderboards	Sorted Sets для рейтингів

Redis Cluster для горизонтального масштабування, Sentinel для автоматичного failover. Замовте консультацію щодо оптимізації Redis для вашого проекту.

Що входить в роботу під ключ

Архітектурне проектування (документація API, схема БД, діаграма сервісів)
Реалізація за узгодженим ТЗ з code review
Налаштування CI/CD (GitHub Actions, Docker), моніторингу (Sentry, Grafana), алертингу
Навантажувальне тестування (k6, wrk) зі звітом
Передача вихідних кодів, доступів, інструкція з деплою
Навчання команди замовника (2–3 сесії)
Гарантійна підтримка 1 місяць після здачі

Орієнтири по термінах

Задача	Термін
REST API для мобільного/SPA (середня складність)	6–12 тижнів
Backend зі складною бізнес-логікою + інтеграції	12–20 тижнів
Високонавантажений сервіс на Go	8–16 тижнів
Міграція legacy PHP на Laravel	16–32 тижні

Вартість розраховується індивідуально після аналізу вимог до навантаження, інтеграцій та бізнес-логіки. Зв'яжіться з нами для безкоштовного аудиту вашого поточного backend — отримайте план оптимізації за 2 дні. Замовте консультацію та дізнайтеся, як знизити витрати на інфраструктуру на 30% без втрати продуктивності.