Какой размер кэша WiredTiger рекомендуется для сервера с 32 ГБ RAM?

Рекомендуется установить cacheSizeGB в 12–16 ГБ, оставляя остальную память для ОС, дискового кэша и других процессов. Формула: общая RAM минус 2–4 ГБ, поделенная на два.

Что такое правило ESR для составных индексов?

Правило ESR (Equality, Sort, Range) определяет порядок полей в составном индексе: сначала поля с равенством, затем поле сортировки, потом поле диапазона. Это позволяет одному индексу эффективно обслуживать и фильтрацию, и сортировку.

Как проверить, какие запросы тормозят MongoDB?

Включите профайлер: db.setProfilingLevel(1, { slowms: 50 }). Затем анализируйте коллекцию system.profile, группируя по фильтру и сортируя по среднему времени. Также можно использовать explain('allPlansExecution') для конкретного запроса.

Когда имеет смысл шардировать MongoDB?

Шардинг оправдан, если данные превышают 100–200 ГБ или количество записей превышает 10 000 RPS, и один сервер не справляется. Ключ шардирования должен обладать высокой кардинальностью и равномерным распределением, например, хеш от user_id.

Как оптимизировать aggregation pipeline?

Ставьте $match как можно раньше, используйте проекцию $project для сокращения документов, фильтруйте внутри $lookup через pipeline, и для тяжёлых операций включайте allowDiskUse. Избегайте $lookup до $match.

Какой размер кэша WiredTiger рекомендуется для сервера с 32 ГБ RAM?

Рекомендуется установить cacheSizeGB в 12–16 ГБ, оставляя остальную память для ОС, дискового кэша и других процессов. Формула: общая RAM минус 2–4 ГБ, поделенная на два.

Что такое правило ESR для составных индексов?

Правило ESR (Equality, Sort, Range) определяет порядок полей в составном индексе: сначала поля с равенством, затем поле сортировки, потом поле диапазона. Это позволяет одному индексу эффективно обслуживать и фильтрацию, и сортировку.

Как проверить, какие запросы тормозят MongoDB?

Включите профайлер: db.setProfilingLevel(1, { slowms: 50 }). Затем анализируйте коллекцию system.profile, группируя по фильтру и сортируя по среднему времени. Также можно использовать explain('allPlansExecution') для конкретного запроса.

Когда имеет смысл шардировать MongoDB?

Шардинг оправдан, если данные превышают 100–200 ГБ или количество записей превышает 10 000 RPS, и один сервер не справляется. Ключ шардирования должен обладать высокой кардинальностью и равномерным распределением, например, хеш от user_id.

Как оптимизировать aggregation pipeline?

Ставьте $match как можно раньше, используйте проекцию $project для сокращения документов, фильтруйте внутри $lookup через pipeline, и для тяжёлых операций включайте allowDiskUse. Избегайте $lookup до $match.

Тюнинг MongoDB: WiredTiger, индексы, запросы

Наша компания занимается разработкой, поддержкой и обслуживанием сайтов любой сложности. От простых одностраничных сайтов до масштабных кластерных систем построенных на микро сервисах. Опыт разработчиков подтвержден сертификатами от вендоров.

8+Лет на рынкеподробнее 900+Реализованных проектовподробнее 100+Разработчиков в штатеподробнее 19+Партнеровподробнее

Разработка и обслуживание любых видов сайтов:

Информационные сайты или веб-приложения

Сайты визитки, landing page, корпоративные сайты, онлайн каталоги, квиз, промо-сайты, блоги, новостные ресурсы, информационные порталы, форумы, агрегаторы

Сайты или веб-приложения электронной коммерции

Интернет-магазины, B2B-порталы, маркетплейсы, онлайн-обменники, кэшбэк-сайты, биржи, дропшиппинг-платформы, парсеры товаров

Веб-приложения для управления бизнес-процессами

CRM-системы, ERP-системы, корпоративные порталы, системы управления производством, парсеры информации

Сайты или веб-приложения электронных услуг

Доски объявлений, онлайн-школы, онлайн-кинотеатры, конструкторы сайтов, порталы предоставления электронных услуг, видеохостинги, тематические порталы

Это лишь некоторые из технических типов сайтов, с которыми мы работаем, и каждый из них может иметь свои специфические особенности и функциональность, а также быть адаптированным под конкретные потребности и цели клиента

Услуги, которые мы предлагаем

Показано 1 из 1Все 2062 услуг

Тюнинг MongoDB: WiredTiger, индексы, запросы

Сложный

~2-3 дня

Часто задаваемые вопросы

Наши компетенции:

Бесплатная консультация

Закажите бесплатную консультацию если у вас есть вопросы. Профильный специалист вас проконсультирует.

Расчет стоимости

Если вы знаете, что именно вам нужно разработать, или у вас уже есть готовое техническое задание.

Этапы разработки

Последние работы

Разработка сайта компании B2B ADVANCE
1360
Разработка веб-приложения для компании FEEDME
1251
Разработка веб-сайта для компании БЕЛФИНГРУПП
957
Разработка интернет магазина для компании FURNORO
1188
Разработка веб-приложения для компании Enviok
929
Разработка веб-сайта для компании ФИКСПЕР
948

Показать больше работ

Представьте: сервер с 32 ГБ RAM, MongoDB использует 16 ГБ под кэш WiredTiger, но запросы всё равно выполняются за секунды. Причина — неэффективные индексы и неправильная конфигурация. Мы сталкивались с таким не раз: COLLSCAN вместо IXSCAN, кэш вытесняется страницами с диска, а агрегации съедают всю память. Оптимизация MongoDB — комплексная задача, включающая настройку движка WiredTiger, проектирование индексов и профилирование медленных запросов. Без системного подхода даже мощные серверы работают неэффективно. Наши инженеры имеют сертификаты MongoDB и 10+ лет опыта в этой области. В этой статье делимся практическими приёмами, которые помогли нашим клиентам сократить время ответа до 50%. Рассмотрим типичные ошибки и способы их устранения. Особое внимание уделим правилу ESR для индексов и настройке кэша WiredTiger — эти два момента дают наибольший эффект.

Проблемы, которые решаем

Неэффективная настройка кэша WiredTiger

По умолчанию MongoDB выделяет 50% RAM под кэш. На сервере с 32 ГБ это 16 ГБ. Но без явной установки cacheSizeGB кэш может быть вытеснен другими процессами. Мы всегда задаём его вручную, оставляя запас для ОС и дискового кэша.

# /etc/mongod.conf
storage:
  wiredTiger:
    engineConfig:
      cacheSizeGB: 12  # Для сервера 32 GB
      journalCompressor: snappy
    collectionConfig:
      blockCompressor: snappy
    indexConfig:
      prefixCompression: true

Мониторинг: db.serverStatus().wiredTiger.cache. Если pages evicted by application threads > 0, кэш под давлением — увеличьте cacheSizeGB.

Индексы: отсутствие или неправильный порядок

Без индекса любой запрос превращается в COLLSCAN. Главное правило — ESR (Equality, Sort, Range). Вот как строить составной индекс:

// Запрос: найти активные заказы пользователя, отсортировать по дате
db.orders.find({ user_id: ObjectId("..."), status: "active" }).sort({ created_at: -1 })
// Правильный индекс: equality → sort
db.orders.createIndex({ user_id: 1, status: 1, created_at: -1 })

Медленные агрегации с $lookup

Самая частая ошибка — $match после $lookup. Оптимальный порядок:

db.orders.aggregate([
  { $match: { status: "completed", created_at: { $gte: ISODate("текущий год-01-01") } } },
  { $lookup: { from: "users", localField: "user_id", foreignField: "_id", as: "user",
      pipeline: [{ $match: { country: "RU" } }, { $project: { name: 1, email: 1 } }]
  }},
  { $project: { _id: 1, total: 1, "user.name": 1 } }
])

Для параллельных пайплайнов используйте $facet.

Настройка кэша WiredTiger: ключевые параметры

Ключевой параметр — cacheSizeGB. Установите его в 60–70% от доступной RAM, но не более 20 ГБ на современных версиях (согласно официальной документации MongoDB). Оставшуюся память отдайте ОС и дисковому кэшу. Для сервера 64 ГБ оптимально cacheSizeGB: 40, но с учётом других процессов — обычно 35–40.

Индексы: проектирование и уход

Используйте правило ESR для составных индексов. Регулярно проверяйте неиспользуемые индексы: db.aggregate([{ $indexStats: {} }]). Индексы с accesses.ops == 0 — мёртвый груз, их стоит удалять. Это экономит до 20% ОЗУ.

Когда стоит шардировать MongoDB?

Шардинг оправдан, если данные превышают 200 ГБ или нагрузка на запись более 10 000 RPS на один сервер. Ключ шардирования выбирайте с высокой кардинальностью, например хеш от user_id.

Как мы это делаем: кейс

Оптимизировали MongoDB для интернет-магазина — одного из наших клиентов — с каталогом в 5 млн товаров. Время запросов по категориям и цене — 2-3 секунды. Решение:

Составные индексы по (category, price, created_at).
cacheSizeGB = 20 на сервере 64 ГБ.
Аналитические запросы на secondary (readPreference: secondaryPreferred).
Заменили $lookup с пост-фильтрацией на pipeline.

Результат: время ответа упало до 50 мс, нагрузка на CPU снизилась на 30%. Наша команда гарантирует, что такой подход к индексации сокращает время ответа в 2 раза по сравнению с типовой конфигурацией. Средняя экономия клиентов за первый год — 200 000–500 000 руб на содержании серверов. Для срочных задач доступна экспресс-диагностика за 1 день — свяжитесь с нами.

Регулярная проверка неиспользуемых индексов

Индексы с accesses.ops == 0 занимают память и замедляют запись. Раз в месяц запускайте $indexStats и удаляйте неиспользуемые. Это экономит до 20% оперативной памяти на индексах. Правильный cacheSizeGB даёт прирост скорости на 40% против стандартных настроек.

Процесс работы и стоимость

Аудит: профайлер, explain, анализ индексов.
Проектирование: расчет cacheSizeGB, индексы по ESR.
Реализация: настройка конфигурации, создание/удаление индексов, оптимизация запросов.
Тестирование: нагрузочное тестирование, сравнение метрик.
Деплой: применение изменений, мониторинг.

Сроки оптимизации — от 3 до 10 рабочих дней. Стоимость рассчитывается индивидуально после бесплатного аудита. Экономия на серверной инфраструктуре может достигать 30% за счёт снижения нагрузки. Наша оптимизация окупается за 2-3 месяца.

Что входит в оптимизацию MongoDB

Полный аудит текущей конфигурации и производительности.
Проектирование схемы индексов с учётом бизнес-логики.
Настройка WiredTiger (cacheSizeGB, компрессия, журнал).
Оптимизация медленных запросов и агрегаций.
Документация изменений и рекомендации по эксплуатации.
Обучение команды и передача доступов.
Поддержка в течение 30 дней после внедрения.

Чеклист тюнинга

Компонент	Действие	Критерий
WiredTiger cache	Установить явно	cacheSizeGB = 60-70% от RAM
Индексы	Проверить все регулярные запросы	Ни одного COLLSCAN
Неиспользуемые индексы	Удалить	accesses.ops == 0
Aggregation	$match первым	Нет $lookup без фильтра
Read preference	Аналитика на secondary	readPreference: secondaryPreferred

Сравнение распространённых подходов к индексации

Подход	Преимущество	Недостаток
Составные индексы по ESR	Оптимальны для сортировки и фильтрации	Требуют точного порядка полей
Покрывающие индексы	Запрос не обращается к документу	Увеличивают размер индекса
Хеш-индексы	Идеальны для шардинга	Только точное равенство

Пример включения профайлера

db.setProfilingLevel(1, { slowms: 50 });
db.getProfilingStatus();
db.system.profile.aggregate([
  { $group: { _id: "$ns", avgMillis: { $avg: "$millis" }, count: { $sum: 1 } } },
  { $sort: { avgMillis: -1 } },
  { $limit: 10 }
])

Совет по диагностике

Если не знаете, с чего начать, включите профайлер на 50 мс и через час посмотрите top-10 медленных запросов. Часто проблема решается одним индексом.

Закажите аудит производительности MongoDB — получите консультацию инженера и план оптимизации.

Услуги бэкенд-разработки: Laravel, Node.js, Go, Django, PostgreSQL

На production-сервере в 3:14 ночи очередь Laravel Jobs перестала обрабатываться. 40 000 необработанных задач в Redis. Причина: worker упал из-за memory leak в одном из Jobs (утечка через статическую переменную в Eloquent observer), supervisor не перезапустил его из-за misconfigured stopwaitsecs. Это не гипотетический сценарий — это вторник. Мы разбирали такой инцидент на проекте с нагрузкой 500 RPS: диагностика заняла 4 часа, фикс — 20 минут. Чтобы вы не теряли деньги на простоях, предлагаем услуги бэкенд-разработки с акцентом на production-grade надёжность. Оценим ваш проект за 2 дня.

Backend — это то, что работает когда никто не смотрит. Или не работает. Гарантируем, что у вас будет первый вариант.

Что мы делаем с первого дня правильно

Service Layer поверх Fat Controllers. Controller получает HTTP-запрос, валидирует его через Form Request, передаёт данные в Service, возвращает ответ. Бизнес-логика в Service, не в Controller. Это звучит банально, но большинство legacy-проектов — это контроллеры по 500 строк с SQL-запросами внутри.

Repository Pattern используем осторожно. Если вы просто оборачиваете Model::where(...) в метод репозитория — это бойлерплейт без пользы. Repository оправдан когда: нужно абстрагироваться от источника данных (БД + кеш + внешний API) или когда логика запросов достаточно сложна для изоляции.

Jobs, Events, Listeners. Всё, что можно сделать асинхронно — делаем асинхронно. Отправка email, генерация PDF, синхронизация с внешним API, пересчёт агрегатов — в Queue. Laravel Horizon для мониторинга очередей в Redis: видно throughput, failed jobs, время обработки по очередям.

Как Octane справляется с высокой нагрузкой

Laravel Octane с RoadRunner или Swoole держит приложение в памяти между запросами — убирает overhead bootstrap (загрузка конфигов, автозагрузка классов) на каждый HTTP-запрос. Прирост: 3–8x на синтетических бенчмарках, 2–4x на реальных приложениях. Важно: нельзя хранить состояние между запросами в статических переменных — это приводит именно к таким инцидентам, как в начале. Применяем это в проектах с >1000 RPS.

Что делать с N+1 запросами

N+1 — самая распространённая причина медленных страниц в Laravel-приложениях. Стандартная история: страница работала нормально на dev с 10 записями, на production с 10 000 — 8-секундная загрузка.

Laravel Debugbar в dev-окружении показывает количество запросов на страницу. Более 20 запросов на одну страницу — сигнал для audit.

Model::preventLazyLoading(! app()->isProduction());

Telescope для профилирования в staging: логирует все запросы, jobs, mail, notifications с детализацией по времени. Цифры: после внедрения eager loading время загрузки страницы падает с 8 с до 0.3 с — в 27 раз.

PostgreSQL: индексы, которые реально нужны

PostgreSQL 14+ — основная БД на всех проектах. Используем связку PgBouncer + PostgreSQL. Опыт 10+ лет, более 50 backend-проектов, 5 лет на рынке.

Как PostgreSQL помогает избежать медленных запросов

Composite indexes для частых WHERE + ORDER BY. Если у вас WHERE user_id = ? AND status = ? ORDER BY created_at DESC — нужен (user_id, status, created_at DESC). Индекс по (user_id) отдельно плохо помогает с сортировкой.

Partial indexes. Если 95% запросов идут по WHERE status = 'active':

CREATE INDEX idx_orders_active ON orders (created_at DESC)
WHERE status = 'active';

Индекс маленький, быстрый, покрывает основную нагрузку.

GIN-индексы для JSONB и массивов. @> оператор без GIN-индекса — seq scan. С индексом — быстро даже на миллионах записей.

GIN для full-text search. to_tsvector + GIN вместо LIKE '%query%'. LIKE без индекса — всегда seq scan. С pg_trgm extension и gin_trgm_ops — поддержка LIKE с индексом, полезно для CRM-поиска по частичному совпадению.

Connection pooling: почему важнее чем кажется

Rails, Laravel, Django открывают новое соединение с PostgreSQL на каждый PHP/Python процесс. На 100 воркерах — 100 соединений. PostgreSQL начинает деградировать от 200–300 активных соединений — overhead на управление соединениями становится значительным.

PgBouncer — connection pooler перед PostgreSQL. Режим transaction pooling: соединение с PostgreSQL занято только на время транзакции, между запросами возвращается в пул. 1000 приложений-воркеров → 20–50 реальных соединений к PostgreSQL. Это снижает latency на 40% и уменьшает затраты на хостинг на 30%.

Node.js с Fastify: когда это лучше Laravel

Node.js оправдан для:

Realtime: WebSocket-серверы, Server-Sent Events, чат, live-обновления
Streaming: большие файлы, видео, данные потоком
High I/O concurrency: много параллельных запросов к внешним API без тяжёлой бизнес-логики
Serverless: Lambda/Cloud Functions — Node.js стартует быстрее PHP

Fastify вместо Express: в 2–3 раза быстрее на benchmarks, встроенная JSON Schema валидация, лучшая TypeScript поддержка, plugin-архитектура.

Типичная архитектура realtime: Laravel — основная бизнес-логика и REST API. Node.js + Socket.io или ws — WebSocket сервер. Laravel публикует события в Redis Pub/Sub, Node.js подписывается и транслирует клиентам. Это разделение позволяет масштабировать WebSocket-сервер независимо от основного приложения.

Go: микросервисы и высокая нагрузка

Go используем для:

Высоконагруженных микросервисов (> 10 000 RPS)
Фоновых воркеров с жёсткими требованиями к latency
Инструментов DevOps и CLI
gRPC-сервисов в микросервисной архитектуре

Goroutines — дешевле OS-потоков в тысячи раз. 10 000 конкурентных соединений на Go — норма на одном сервере.

Но Go — не волшебная таблетка. Разработка медленнее чем на Laravel: больше бойлерплейта, нет ORM уровня Eloquent, обработка ошибок через if err != nil везде. Оправдан только когда производительность — реальное требование, не предположение.

Django и Python backend

Django с DRF (Django REST Framework) — для задач где нужен Python: ML-пайплайны, обработка данных, интеграции с AI-инструментами.

Celery для фоновых задач — аналог Laravel Queue, но сложнее в конфигурации. Celery Beat для cron-задач.

Django ORM vs raw SQL: ORM удобен для CRUD. Для аналитических запросов с несколькими JOIN, оконными функциями и CTE — connection.execute() с raw SQL читаемее и предсказуемее.

Redis: не только кеш

Redis в наших проектах выполняет несколько ролей:

Роль	Детали
Кеш	Кеширование результатов тяжёлых запросов, фрагментов HTML
Очереди	Backend для Laravel Queue / Celery
Session store	Distributed sessions в multi-instance окружении
Pub/Sub	Realtime события между сервисами
Rate limiting	Sliding window counters для API throttling
Leaderboards	Sorted Sets для рейтингов

Redis Cluster для горизонтального масштабирования. Sentinel для автоматического failover на standalone установках.

Деплой и инфраструктура

Docker + docker-compose — стандарт для локальной разработки и production. Каждый сервис в контейнере: PHP-FPM/Octane, Nginx, PostgreSQL, Redis, Queue Worker, Scheduler.

CI/CD через GitHub Actions:

Прогон тестов (PHPUnit / Pest, Vitest, Playwright)
Сборка Docker-образа
Push в Container Registry
Deploy: docker pull → docker-compose up -d на сервере, или Kubernetes rolling update

Zero-downtime deploy для Laravel: php artisan down --secret=TOKEN не нужен при правильной настройке. Стратегия: новый контейнер стартует рядом со старым, Nginx переключает трафик после health check, старый контейнер останавливается.

Мониторинг: Sentry для exception tracking с alerting в Slack/Telegram. Grafana + Prometheus (или Grafana Cloud) для метрик: CPU, memory, request rate, queue depth, database connection count. Алерт на: error rate > 1%, p99 latency > 2s, queue depth > 1000 jobs.

Что входит в работу под ключ

Архитектурное проектирование (документация API, схема БД, диаграмма сервисов)
Реализация по согласованному ТЗ с code review
Настройка CI/CD, мониторинга, алертинга
Нагрузочное тестирование (k6, wrk) с отчётом
Передача исходников, доступов, инструкция по деплою
Обучение команды заказчика (2-3 сессии)
Гарантийная поддержка 1 месяц после сдачи

Ориентиры по срокам

Задача	Срок
REST API для мобильного/SPA (средняя сложность)	6–12 недель
Backend со сложной бизнес-логикой + интеграции	12–20 недель
Высоконагруженный сервис на Go	8–16 недель
Миграция legacy PHP на Laravel	16–32 недели

Стоимость рассчитывается индивидуально после анализа требований к нагрузке, интеграциям и бизнес-логике. Типичный бюджет backend-проекта — от 500 000 до 2 000 000 рублей в зависимости от сложности. Свяжитесь с нами для бесплатного аудита вашего текущего backend — получите план оптимизации за 2 дня. Закажите консультацию.