Сколько времени занимает разработка рекомендательной системы?

От 30 до 60 рабочих дней в зависимости от объёма данных и сложности интеграции. Мы предоставляем детальный план проекта на бесплатной консультации.

Какие данные нужны для обучения модели?

Минимально — история взаимодействий пользователей (клики, просмотры, покупки) и описание товаров/контента. Чем больше разнообразных признаков, тем выше точность.

Как решается проблема холодного старта?

Используем content-based фильтрацию на основе семантических эмбеддингов, пока не накоплено 3-5 взаимодействий, затем переключаемся на collaborative. Это даёт Recall@10 до 20% для новых пользователей.

Какие метрики улучшаются после внедрения?

CTR растет до 8-15%, конверсия из рекомендаций 3-7%, дополнительная выручка 12-25%. Мы гарантируем измеримый результат через A/B тестирование.

Поддерживаете ли вы готовые решения?

Да, мы разрабатываем под ключ: от архитектуры до продакшена, включая интеграцию, документацию и обучение команды. 12 месяцев гарантии и обновлений.

Сколько времени занимает разработка рекомендательной системы?

От 30 до 60 рабочих дней в зависимости от объёма данных и сложности интеграции. Мы предоставляем детальный план проекта на бесплатной консультации.

Какие данные нужны для обучения модели?

Минимально — история взаимодействий пользователей (клики, просмотры, покупки) и описание товаров/контента. Чем больше разнообразных признаков, тем выше точность.

Как решается проблема холодного старта?

Используем content-based фильтрацию на основе семантических эмбеддингов, пока не накоплено 3-5 взаимодействий, затем переключаемся на collaborative. Это даёт Recall@10 до 20% для новых пользователей.

Какие метрики улучшаются после внедрения?

CTR растет до 8-15%, конверсия из рекомендаций 3-7%, дополнительная выручка 12-25%. Мы гарантируем измеримый результат через A/B тестирование.

Поддерживаете ли вы готовые решения?

Да, мы разрабатываем под ключ: от архитектуры до продакшена, включая интеграцию, документацию и обучение команды. 12 месяцев гарантии и обновлений.

Two-Tower и FAISS: AI-рекомендательная система для персонализации

Проектируем и внедряем системы искусственного интеллекта: от прототипа до production-ready решения. Наша команда объединяет экспертизу в машинном обучении, дата-инжиниринге и MLOps, чтобы AI работал не в лаборатории, а в реальном бизнесе.

8+Лет на рынкеподробнее 900+Реализованных проектовподробнее 100+Разработчиков в штатеподробнее 19+Партнеровподробнее

Услуги, которые мы предлагаем

Показано 1 из 1Все 1564 услуг

Two-Tower и FAISS: AI-рекомендательная система для персонализации

Сложный

~2-4 недели

Часто задаваемые вопросы

Направления AI-разработки

Обсудить AI-проект

Бесплатная консультация — расскажем, как AI решит вашу задачу

Оценить стоимость

Рассчитаем бюджет и сроки вашего AI-проекта

Этапы разработки AI-решения

Последние работы

Разработка сайта компании B2B ADVANCE
1348
Разработка веб-приложения для компании FEEDME
1247
Разработка веб-сайта для компании БЕЛФИНГРУПП
949
Разработка интернет магазина для компании FURNORO
1183
Разработка логотипа компании B2B Advance
642
Разработка веб-приложения для компании Enviok
921

Показать больше работ

Новый пользователь заходит на маркетплейс — система не знает его вкусы. Он видит популярные товары, но конверсия падает. Это типичный cold-start. Архитектура Two-Tower + FAISS — проверенный production-ready подход, который даёт CTR 8-15% и дополнительную выручку 12-25%. Мы реализовали десятки таких проектов, от стартапов до enterprise.

Рассмотрим ключевые проблемы: cold-start, масштабирование до миллионов транзакций, баланс точности и latency. Каждая требует отдельного решения. Production-ready разработка AI-рекомендательной системы строится на Two-Tower нейронной сети и FAISS индексе.

Как Two-Tower решает проблему холодного старта?

Холодный старт для новых пользователей — типичная боль. Без истории покупок система выдает случайные товары, конверсия падает. Наш подход использует семантические эмбеддинги товаров и демографические признаки, чтобы дать релевантные рекомендации с первого визита. Matrix Factorization работает, но только для пользователей с историей — для холодного старта нужны контентные признаки.

Используем гибридный подход: content-based фильтрация на основе текстовых эмбеддингов (BERT, 768-dim) для новых пользователей, а после накопления 3–5 взаимодействий переключаемся на collaborative filtering. Recall@10 для холодных пользователей достигает 20% против 5% у чистого MF.

Почему Two-Tower архитектура эффективнее content-based?

Two-tower позволяет учить эмбеддинги пользователей и товаров в едином пространстве, обучаясь на implicit feedback (клики, просмотры). Это даёт CTR 8-15% против 2-4% у rule-based систем. На больших объёмах (> 5M транзакций) early fusion не масштабируется — two-tower с in-batch negatives обучается за 2-3 часа на 8 V100.

Объём транзакций	Рекомендованный подход	Recall@10	Latency
< 10K	Content-based + правила	15-25%	< 5ms
10K – 500K	Matrix Factorization (ALS)	25-40%	< 20ms
500K – 5M	Two-tower neural + MF ensemble	35-50%	< 50ms
> 5M	Two-tower + GNN + re-ranking	45-65%	< 100ms

Сравнение метрик до и после внедрения

Метрика	Без рекомендаций	С нашей системой
CTR рекомендаций	2–4%	8–15%
Конверсия из рекомендаций	1–2%	3–7%
Дополнительная выручка	0%	12–25%
Время холодного старта	10+ взаимодействий	3–5 взаимодействий

В результате внедрения дополнительная выручка возрастает на 12–25%, что для крупного e-commerce площадки может составить миллионы рублей в месяц.

Техническая реализация: Two-Tower, обучение и инференс

Архитектура Two-Tower

import torch
import torch.nn as nn
import numpy as np
from torch.utils.data import DataLoader, Dataset

class UserTower(nn.Module):
    """Энкодер пользователя"""
    def __init__(self, n_users: int, n_categories: int,
                 embedding_dim: int = 64, hidden_dim: int = 128):
        super().__init__()
        self.user_emb = nn.Embedding(n_users + 1, embedding_dim, padding_idx=0)
        self.category_emb = nn.Embedding(n_categories + 1, 16, padding_idx=0)

        self.mlp = nn.Sequential(
            nn.Linear(embedding_dim + 16 * 5 + 10, hidden_dim),
            nn.ReLU(),
            nn.Dropout(0.3),
            nn.Linear(hidden_dim, 64),
            nn.LayerNorm(64)
        )

    def forward(self, user_id, top_categories, behavior_features):
        user_vec = self.user_emb(user_id)
        cat_vecs = self.category_emb(top_categories).view(top_categories.shape[0], -1)
        combined = torch.cat([user_vec, cat_vecs, behavior_features], dim=1)
        return self.mlp(combined)


class ItemTower(nn.Module):
    """Энкодер предмета (товара/контента)"""
    def __init__(self, n_items: int, n_categories: int,
                 embedding_dim: int = 64, text_dim: int = 128):
        super().__init__()
        self.item_emb = nn.Embedding(n_items + 1, embedding_dim, padding_idx=0)
        self.category_emb = nn.Embedding(n_categories + 1, 16, padding_idx=0)

        self.mlp = nn.Sequential(
            nn.Linear(embedding_dim + 16 + text_dim + 5, 128),
            nn.ReLU(),
            nn.Dropout(0.3),
            nn.Linear(128, 64),
            nn.LayerNorm(64)
        )

    def forward(self, item_id, category_id, text_features, item_features):
        item_vec = self.item_emb(item_id)
        cat_vec = self.category_emb(category_id)
        combined = torch.cat([item_vec, cat_vec, text_features, item_features], dim=1)
        return self.mlp(combined)


class TwoTowerModel(nn.Module):
    def __init__(self, n_users, n_items, n_categories, text_dim=128):
        super().__init__()
        self.user_tower = UserTower(n_users, n_categories)
        self.item_tower = ItemTower(n_items, n_categories, text_dim=text_dim)
        self.temperature = nn.Parameter(torch.ones(1) * 0.05)

    def forward(self, user_inputs, item_inputs):
        user_emb = self.user_tower(**user_inputs)
        item_emb = self.item_tower(**item_inputs)

        # Cosine similarity
        user_norm = nn.functional.normalize(user_emb, dim=1)
        item_norm = nn.functional.normalize(item_emb, dim=1)
        scores = torch.sum(user_norm * item_norm, dim=1) / self.temperature
        return scores

    def get_user_embedding(self, user_inputs) -> torch.Tensor:
        with torch.no_grad():
            return nn.functional.normalize(self.user_tower(**user_inputs), dim=1)

    def get_item_embedding(self, item_inputs) -> torch.Tensor:
        with torch.no_grad():
            return nn.functional.normalize(self.item_tower(**item_inputs), dim=1)

In-Batch Negative Sampling обучение

class RecommendationTrainer:
    def __init__(self, model: TwoTowerModel, lr: float = 1e-3):
        self.model = model
        self.optimizer = torch.optim.Adam(model.parameters(), lr=lr)
        self.scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(
            self.optimizer, T_max=10
        )

    def train_epoch(self, dataloader: DataLoader) -> float:
        self.model.train()
        total_loss = 0

        for batch in dataloader:
            user_inputs, pos_item_inputs = batch['user'], batch['positive_item']

            # User embeddings: [batch_size, dim]
            user_embs = nn.functional.normalize(
                self.model.user_tower(**user_inputs), dim=1
            )
            # Item embeddings: [batch_size, dim]
            item_embs = nn.functional.normalize(
                self.model.item_tower(**pos_item_inputs), dim=1
            )

            # In-batch negatives: матрица схожестей [batch_size x batch_size]
            scores = torch.matmul(user_embs, item_embs.T) / self.model.temperature

            # Диагональ = позитивные примеры
            labels = torch.arange(len(user_embs)).to(scores.device)
            loss = nn.functional.cross_entropy(scores, labels)

            self.optimizer.zero_grad()
            loss.backward()
            torch.nn.utils.clip_grad_norm_(self.model.parameters(), 1.0)
            self.optimizer.step()

            total_loss += loss.item()

        self.scheduler.step()
        return total_loss / len(dataloader)

ANN-индекс для реального времени

import faiss

class RecommendationIndex:
    """Индекс для быстрого поиска top-K рекомендаций"""

    def __init__(self, dim: int = 64, n_items: int = 100000):
        # IVF-PQ индекс: компромисс скорость/точность
        quantizer = faiss.IndexFlatIP(dim)
        n_lists = min(int(np.sqrt(n_items)), 4096)
        self.index = faiss.IndexIVFPQ(quantizer, dim, n_lists, 8, 8)
        self.index.nprobe = 32  # Число clusters для поиска
        self.item_ids = []

    def build(self, item_embeddings: np.ndarray, item_ids: list):
        """Построение индекса из эмбеддингов"""
        embeddings_norm = item_embeddings / np.linalg.norm(
            item_embeddings, axis=1, keepdims=True
        )
        self.index.train(embeddings_norm.astype(np.float32))
        self.index.add(embeddings_norm.astype(np.float32))
        self.item_ids = item_ids

    def recommend(self, user_embedding: np.ndarray,
                   k: int = 50,
                   exclude_ids: list = None) -> list[tuple]:
        """Top-K рекомендаций для пользователя"""
        user_norm = user_embedding / np.linalg.norm(user_embedding)
        scores, indices = self.index.search(
            user_norm.reshape(1, -1).astype(np.float32),
            k + (len(exclude_ids) if exclude_ids else 0) + 10
        )

        results = []
        for score, idx in zip(scores[0], indices[0]):
            if idx < 0:
                continue
            item_id = self.item_ids[idx]
            if exclude_ids and item_id in exclude_ids:
                continue
            results.append((item_id, float(score)))
            if len(results) >= k:
                break

        return results

Re-ranking и бизнес-правила

class RecommendationReranker:
    """Применение бизнес-логики к кандидатам от retrieval модели"""

    def rerank(self, candidates: list[tuple],
                user_context: dict,
                business_rules: dict) -> list[tuple]:
        """
        candidates: [(item_id, base_score)]
        business_rules: {'boost_new_items': 1.2, 'boost_on_sale': 1.15, 'max_same_category': 3}
        """
        scored_candidates = []

        category_count = {}
        for item_id, base_score in candidates:
            item = self._get_item_metadata(item_id)
            if item is None:
                continue

            # Применение буста
            score = base_score
            if business_rules.get('boost_new_items') and item.get('is_new'):
                score *= business_rules['boost_new_items']
            if business_rules.get('boost_on_sale') and item.get('on_sale'):
                score *= business_rules['boost_on_sale']

            # Лимит категорий
            cat = item.get('category')
            max_per_cat = business_rules.get('max_same_category', 5)
            if category_count.get(cat, 0) >= max_per_cat:
                continue
            category_count[cat] = category_count.get(cat, 0) + 1

            scored_candidates.append((item_id, score))

        return sorted(scored_candidates, key=lambda x: x[1], reverse=True)

Типовые метрики после внедрения рекомендательной системы: CTR рекомендаций 8-15% (против 2-4% популярных товаров), конверсия из рекомендации 3-7%, дополнительная выручка 12-25% от общего оборота. Время холодного старта для новых пользователей без истории: 3-5 взаимодействий для получения персонализированных рекомендаций.

Процесс работы, состав и стоимость

Аналитика: аудит данных, профилирование пользователей, определение бизнес-целей.
Проектирование: выбор архитектуры (content-based, collaborative, two-tower), пайплайны обучения.
Разработка: реализация моделей (PyTorch), обучение на исторических данных, настройка ANN-индекса (FAISS).
Интеграция: REST API, gRPC, контейнеризация (Docker), развертывание в Kubernetes.
A/B тестирование: метрики (Recall, NDCG, доля выручки), мониторинг дрейфа данных.
Поддержка: 12 месяцев гарантии, обновление моделей, доработка бизнес-правил.

Что входит в работу

Архитектурный документ (выбор подходов, обоснование)
Исходный код моделей и пайплайнов (PyTorch, FAISS)
Docker-образы и Kubernetes manifests
REST API / gRPC для real-time инференса
Интеграция с вашей CRM/сайтом
Документация и обучение команды
A/B тестирование и настройка мониторинга (Prometheus + Grafana)
12 месяцев поддержки и обновлений

Сроки: от 30 до 60 рабочих дней в зависимости от объёма данных и сложности интеграции. Стоимость рассчитывается индивидуально — мы оценим ваш проект за 1 день после знакомства с задачей.

Десятки реализованных проектов — от стартапов до enterprise. Дополнительная выручка после внедрения исчисляется миллионами рублей в месяц. Закажите разработку AI-рекомендательной системы и получите консультацию по архитектуре вашего проекта.

Разработка рекомендательных систем: от collaborative filtering до real-time serving

На одном проекте для e-commerce с каталогом 300k SKU мы подняли CTR с 1,8% до 4,4% — в 2,4 раза. Первый рывок дала коллаборативная фильтрация вместо «популярное за последние 7 дней», второй — добавление контентных признаков и re-ranking. Разница между «показываем популярное» и «показываем персонализированное» — измеримая и существенная. Ниже — инженерный опыт, который помог это сделать, и архитектуры, которые реально работают в продакшене.

Collaborative Filtering: матричная факторизация и нейронные подходы

Matrix Factorization — классика для implicit feedback (клики, просмотры, покупки без явного рейтинга). ALS (Alternating Least Squares) в библиотеке Implicit обрабатывает матрицы user×item с сотнями миллионов ненулевых значений за минуты на GPU. Latent factors 64–256, регуляризация λ=0.01–0.1 — стартовые параметры. Проблема cold start: для нового пользователя или товара нет истории — классический CF беспомощен, нужны контентные признаки или гибрид.

Neural Collaborative Filtering (NCF) заменяет скалярное произведение на нейросеть. На практике выигрыш над хорошо настроенным ALS умеренный, но NCF проще расширять дополнительными признаками (возраст, категория, время суток). Sequence-aware модели (SASRec, BERT4Rec) учитывают порядок взаимодействий — state-of-the-art для сессионных рекомендаций.

Как выбрать архитектуру рекомендательной системы?

Ответ зависит от данных, нагрузки и требований к холодному старту. Ниже — три основных подхода с критериями выбора.

Критерий	Collaborative Filtering	Content-Based Filtering	Гибридный (two-stage)
Данные для старта	История взаимодействий	Признаки объектов и пользователей	И то, и другое
Cold start	Провальный	Работает для новых items	Частично решён
Diversity (long-tail)	Низкий, popularity bias	Высокий	Средний–высокий
Latency serving	<5 ms (precomputed)	<10 ms (FAISS)	20–50 ms
Сложность внедрения	Низкая	Средняя	Высокая

Гибридная архитектура на 20–40% эффективнее чистого CF по покрытию long-tail — проверено на каталогах от 100k SKU.

Content-Based Filtering: когда истории взаимодействий мало

Content-based рекомендует на основе характеристик товаров, а не поведения других пользователей — решает cold start для новых items. Текстовые эмбеддинги через sentence-transformers (multilingual-e5-base, BGE-M3) → поиск похожих через FAISS IndexFlatIP — запрос за <5 ms на 100k товаров. Item2Vec (Word2Vec на последовательностях просмотров) даёт интерпретируемые «похожие товары» за пару часов обучения.

Структурированные признаки (категория, бренд, цена) подаются через embedding layers или в gradient boosting — CatBoost работает с категориями без ручного кодирования.

Почему гибридные модели работают лучше?

Production-системы почти всегда двухуровневые. Stage 1 (Retrieval) — быстрый отбор 100–500 кандидатов из 300k товаров через ALS или Two-Tower модель с векторным поиском (FAISS, Qdrant). Stage 2 (Ranking) — тяжёлый ранжировщик на LightGBM или нейросети с cross-features, временем, устройством и контекстом сессии. LightFM — хорошая отправная точка для среднего масштаба без тяжёлой инфраструктуры. Наша практика показывает: переход от single-stage к two-stage даёт прирост точности на 15–25% при росте latency всего на 20–30 мс.

Real-Time Serving: архитектура под нагрузку

Latency SLA — 50–100 ms при тысячах запросов в секунду. Base-рекомендации precompute (batch job раз в час) → Redis по user_id → <5 ms. Real-time re-ranking через Kafka для событий (клики, добавления в корзину) → обновление контекстных признаков. Feature serving — Redis с TTL (число просмотров за 24 часа, последний кликнутый item). При нагрузке 10k req/s ставим Redis Cluster с репликацией.

A/B тестирование — единственный достоверный способ оценить улучшения. Офлайн-метрики коррелируют с онлайн не всегда. Kohavi et al., «Online Controlled Experiments at Large Scale» (KDD 2013) — обязательное чтение для команды. Тест с 5–10% трафика, мониторинг CTR, конверсии, revenue per session. Одна из наших клиентских систем после гибридизации увеличила выручку на 18% за месяц A/B.

Сроки разработки рекомендательной системы

Этапы и типичные временные затраты — в таблице ниже. Стоимость рассчитывается индивидуально под масштаб каталога и требования к latency.

Этап	Длительность	Результат
Аудит данных и baseline	1–2 недели	Отчёт с плотностью матрицы, cold start‑зонами, метриками «популярного»
Прототип (offline validation)	2–3 недели	Работающая модель с офлайн-метриками (Recall@k, NDCG)
Production-система (two-stage, A/B)	1.5–2.5 месяца	Low-latency сервис с мониторингом и A/B-инфраструктурой
Обучение команды и документация	1–2 недели	Model card, runbook по деплою, сессия по дообучению

Что входит в разработку под ключ

Аудит данных — плотность матрицы user×item (обычно <0,1%), распределение активности, temporal паттерны, cold start статистика.
Baseline — «популярное» как простой порог, который часто трудно обогнать.
Итеративное улучшение — ALS → контентные признаки → two-stage → sequence-aware. Каждый шаг с A/B.
Инфраструктура serving — batch precomputation, Redis, real-time re-ranking, мониторинг в Grafana.
Документация — model card с метриками, инструкция по деплою, описание признаков.
Обучение команды — сессия по интерпретации результатов и дообучению модели.
Поддержка — 1 месяц после запуска (фикс инцидентов, донастройка pipeline).

Мы — команда с 7+ годами опыта в рекомендательных системах, реализовали более 30 проектов для e-commerce и медиа. Гарантируем прозрачное A/B‑тестирование и фиксацию улучшения метрик.

Хотите оценить потенциал роста вашего каталога? Свяжитесь с нами для бесплатного аудита данных. Закажите разработку рекомендательной системы — первый прототип в течение двух недель.

Пример конфига ALS для implicit feedback

from implicit.als import AlternatingLeastSquares

model = AlternatingLeastSquares(
    factors=64,
    regularization=0.05,
    iterations=15,
    use_gpu=True
)
model.fit(user_item_matrix)

Больше о математике рекомендательных систем — в Wikipedia.