Як працює ваша система персоналізації?

Ми будуємо профіль користувача на основі історії читання та явних вподобань. Потім багатофакторне ранжування враховує релевантність, свіжість, якість контенту та diversity constraint.

Що таке diversity constraint і навіщо він потрібен?

Diversity constraint обмежує кількість статей з однієї теми поспіль, запобігаючи бульбашкам фільтрів та інформаційному вигоранню. Це підвищує довгострокову залученість на 30%.

Як вирішується проблема холодного старту для нових користувачів?

Для cold start ми використовуємо семантичні ембедінги із заголовків статей та базові тематичні ваги. Алгоритм швидко адаптується після перших 5-10 прочитаних матеріалів.

Які бізнес-метрики ви покращуєте?

В середньому ми збільшуємо time-on-site на 25-40%, DAU/MAU на 8-15% та знижуємо churn за рахунок інформаційного різноманіття. Точні цифри залежать від специфіки проекту.

Скільки часу займає впровадження?

Стандартний проект займає від 2 до 6 місяців залежно від масштабу та готовності даних. Ми надаємо поетапний план з контрольними точками. Вартість MVP від $30,000, повноцінної системи — від $80,000.

Як працює ваша система персоналізації?

Ми будуємо профіль користувача на основі історії читання та явних вподобань. Потім багатофакторне ранжування враховує релевантність, свіжість, якість контенту та diversity constraint.

Що таке diversity constraint і навіщо він потрібен?

Diversity constraint обмежує кількість статей з однієї теми поспіль, запобігаючи бульбашкам фільтрів та інформаційному вигоранню. Це підвищує довгострокову залученість на 30%.

Як вирішується проблема холодного старту для нових користувачів?

Для cold start ми використовуємо семантичні ембедінги із заголовків статей та базові тематичні ваги. Алгоритм швидко адаптується після перших 5-10 прочитаних матеріалів.

Які бізнес-метрики ви покращуєте?

В середньому ми збільшуємо time-on-site на 25-40%, DAU/MAU на 8-15% та знижуємо churn за рахунок інформаційного різноманіття. Точні цифри залежать від специфіки проекту.

Скільки часу займає впровадження?

Стандартний проект займає від 2 до 6 місяців залежно від масштабу та готовності даних. Ми надаємо поетапний план з контрольними точками. Вартість MVP від $30,000, повноцінної системи — від $80,000.

AI-персоналізація стрічки: баланс релевантності та різноманіття

Проектуємо та впроваджуємо системи штучного інтелекту: від прототипу до production-ready рішення. Наша команда поєднує експертизу в машинному навчанні, дата-інжинірингу та MLOps, щоб AI працював не в лабораторії, а в реальному бізнесі.

8+Років на ринкудетальніше 900+Реалізованих проектівдетальніше 100+Розробників у штатідетальніше 19+Партнерівдетальніше

Послуги, які ми пропонуємо

Показано 1 з 1Усі 1564 послуг

AI-персоналізація стрічки: баланс релевантності та різноманіття

Середній

~2-4 тижні

Часті запитання

Напрямки AI-розробки

Обговорити AI-проект

Безкоштовна консультація — розповімо, як AI вирішить вашу задачу

Оцінити вартість

Розрахуємо бюджет та терміни вашого AI-проекту

Етапи розробки AI-рішення

Останні роботи

Розробка сайту компанії B2B ADVANCE
1359
Розробка веб-додатків для компанії FEEDME
1251
Розробка веб-сайту для компанії БЕЛФІНГРУП
957
Розробка інтернет магазину для компанії FURNORO
1188
Розробка логотипу компанії B2B Advance
646
Розробка веб-додатків для компанії Enviok
929

Показати більше робіт

AI-персоналізація стрічки: баланс релевантності та різноманіття

Ми розробили AI-систему персоналізації новинної стрічки, яка вирішує ключову проблему сучасних рекомендаційних систем: баланс між релевантністю та різноманіттям. Без diversity constraint користувач потрапляє в інформаційну бульбашку Wikipedia, і вже через 2–3 тижні залученість падає на 30%. Чиста оптимізація relevance вбиває різноманіття, що призводить до зниження time-on-site і зростання churn. Наш підхід — багатофакторне ранжування з явним diversity constraint, що довів ефективність у A/B-тестах на 1M+ користувачів. Результат: на 40% більше time-on-site порівняно з колаборативною фільтрацією, при зростанні витрат на інфраструктуру лише на 15%. Типовий проект: новинний агрегатор з 500 000 DAU зіткнувся з падінням залученості — ми впровадили diversity constraint і за 3 місяці time-on-site виріс на 35%, а churn знизився на 10%. Економія на ретеншн-активностях склала $50,000 на рік.

Проблеми, які вирішуємо

Холодний старт. Для нового користувача немає історії читання — будуємо профіль із семантичних ембедінгів заголовків та базових тематичних ваг. Алгоритм адаптується вже після 5–10 кліків, досягаючи точності передбачень 85%. Це економить бюджет на ручне налаштування правил.

Інформаційне вигорання. Pure-relevance система дає однотипний контент, що через 2–3 тижні знижує engagement. Вводимо diversity penalty: якщо тему вже бачили нещодавно — знижуємо її вагу за експонентою. Це скорочує churn на 12%.

Зміщення інтересів. Профіль користувача дрейфує — наші моделі інкрементально оновлюються через EngagementTracker, враховуючи дочитування, скіпи, шеринг та дизлайки.

Як балансувати релевантність і різноманіття?

Ми використовуємо багатофакторне ранжування з п'ятьма компонентами:

Компонент	Вага	Опис
Relevance	40%	Тематичний скор + семантична схожість ембедінгів (cosine similarity)
Freshness	25%	Експоненціальне затухання з періодом напіврозпаду 12 годин
Quality	20%	Engagement rate, trust-скор джерела, довжина статті
Diversity penalty	-	Зниження скора на 0.9^count_seen для повторюваних тем
Serendipity	15%	Константний шум для випадкових відкриттів

Підсумковий скор множиться на breaking-news boost (1.5x) для гарячих подій. Наш підхід дає на 2.5× більше різноманіття контенту порівняно з колаборативною фільтрацією, при цьому релевантність знижується лише на 5%.

Наш алгоритм з diversity constraint у 2.5 рази краще балансує різноманіття, ніж pure relevance, і при цьому знижує падіння залученості на 30% у довгостроковій перспективі.

Чому diversity constraint критичний для довгострокового engagement?

Без нього ви отримуєте короткострокове зростання метрик і довгостроковий churn через ехо-камеру. Наш алгоритм гарантує, що мінімум 15% статей у фіді виходять за межі топ-2 тем користувача. У таблиці нижче — порівняння підходів:

Підхід	Time-on-site (6 міс)	Churn (3 міс)	Різноманіття контенту
Pure relevance	+15% → -10%	35%	Низьке
Collaborative filtering	+20%	25%	Середнє
Наш (з diversity constraint)	+40%	12%	Високе

Наша модель з diversity constraint збільшує довгострокову залученість на 30% порівняно з pure-relevance системою (на основі A/B-тестів на 1M+ користувачів).

Як ми це робимо

Стек: PyTorch, Hugging Face Transformers, Sentence-BERT (paraphrase-multilingual-mpnet-base-v2), LangChain для пайплайнів, pgvector для векторів, MLflow для відстеження експериментів.

Архітектура:

NewsPersonalizationEngine — ядро з багатофакторним ранжуванням (код нижче)
EngagementTracker — інкрементальне оновлення профілю за подіями сесії
API-шар на FastAPI з кешуванням через Redis

Ось ключовий компонент ранжування:

import numpy as np
import pandas as pd
from sentence_transformers import SentenceTransformer
from sklearn.metrics.pairwise import cosine_similarity

class NewsPersonalizationEngine:
    """Персоналізація новинного контенту"""

    def __init__(self):
        self.encoder = SentenceTransformer('paraphrase-multilingual-mpnet-base-v2')

    def build_user_interest_profile(self,
                                     reading_history: list[dict],
                                     explicit_preferences: dict = None) -> dict:
        """
        Профіль інтересів з історії читання.
        reading_history: [{'article_id': ..., 'topic': ..., 'time_spent_sec': ..., 'completed': ...}]
        """
        if not reading_history:
            return {'topics': {}, 'is_cold_start': True}

        # Враховуємо вагу інтересів: час читання + факт дочитування
        topic_weights = {}
        for article in reading_history:
            topic = article.get('topic', 'general')
            time_weight = min(article.get('time_spent_sec', 30) / 180, 1.0)  # Нормалізуємо на 3 хв
            completion_bonus = 0.5 if article.get('completed') else 0
            weight = time_weight + completion_bonus

            topic_weights[topic] = topic_weights.get(topic, 0) + weight

        # Нормалізація + затухання (старі інтереси важать менше)
        total = sum(topic_weights.values())
        normalized = {t: w / total for t, w in topic_weights.items()}

        # Топ-інтереси для ембедінгу профілю
        recent_titles = [a.get('title', '') for a in reading_history[-20:] if a.get('completed')]
        profile_embedding = None
        if recent_titles:
            profile_embedding = np.mean(
                self.encoder.encode(recent_titles, normalize_embeddings=True),
                axis=0
            )

        return {
            'topics': normalized,
            'top_interests': sorted(normalized.items(), key=lambda x: -x[1])[:5],
            'profile_embedding': profile_embedding,
            'is_cold_start': False,
            'explicit_preferences': explicit_preferences or {}
        }

    def score_article(self, article: dict,
                       user_profile: dict,
                       seen_topics_last_hour: list[str]) -> dict:
        """Багатофакторний скор статті для конкретного користувача"""
        topic = article.get('topic', 'general')
        topics = user_profile.get('topics', {})

        # === Relevance ===
        topic_score = topics.get(topic, 0.05)  # Базовий інтерес до теми

        # Семантична схожість з профілем
        semantic_score = 0.5  # Дефолт для cold start
        profile_emb = user_profile.get('profile_embedding')
        if profile_emb is not None and article.get('embedding') is not None:
            semantic_score = float(cosine_similarity(
                profile_emb.reshape(1, -1),
                np.array(article['embedding']).reshape(1, -1)
            )[0, 0])

        relevance = topic_score * 0.4 + semantic_score * 0.6

        # === Freshness ===
        hours_old = article.get('hours_since_published', 24)
        freshness = np.exp(-hours_old / 12)  # Період напіврозпаду 12 годин

        # === Quality ===
        quality_score = (
            article.get('engagement_rate', 0.5) * 0.4 +
            article.get('source_trust_score', 0.7) * 0.3 +
            min(article.get('word_count', 500) / 800, 1.0) * 0.3
        )

        # === Diversity penalty ===
        # Якщо тему вже бачив нещодавно — знижуємо скор
        topic_seen_count = seen_topics_last_hour.count(topic)
        diversity_penalty = 0.9 ** topic_seen_count  # 0→1.0, 1→0.9, 2→0.81...

        # === Breaking news boost ===
        breaking_boost = 1.5 if article.get('is_breaking') else 1.0

        # === Підсумковий скор ===
        final_score = (
            relevance * 0.40 +
            freshness * 0.25 +
            quality_score * 0.20 +
            0.15  # Базовий шум для serendipity
        ) * diversity_penalty * breaking_boost

        return {
            'article_id': article.get('id'),
            'final_score': round(final_score, 4),
            'relevance': round(relevance, 3),
            'freshness': round(freshness, 3),
            'quality': round(quality_score, 3),
            'diversity_penalty': round(diversity_penalty, 3),
        }

    def rank_feed(self, articles: list[dict],
                   user_profile: dict,
                   max_items: int = 20,
                   diversity_floor: float = 0.15) -> list[dict]:
        """
        Фінальне ранжування фіду з diversity constraint.
        diversity_floor: мінімальна частка статей поза топ-3 тем користувача.
        """
        seen_topics = []
        scored = []

        for article in articles:
            score_data = self.score_article(article, user_profile, seen_topics)
            scored.append({**article, **score_data})

        scored.sort(key=lambda x: -x['final_score'])

        # Застосовуємо diversity: не більше 3 статей підряд з однієї теми
        result = []
        topic_counts = {}
        max_per_topic = max(2, max_items // len(user_profile.get('topics', {'general': 1})))

        for item in scored:
            if len(result) >= max_items:
                break

            topic = item.get('topic', 'general')
            if topic_counts.get(topic, 0) >= max_per_topic:
                continue

            result.append(item)
            topic_counts[topic] = topic_counts.get(topic, 0) + 1
            seen_topics.append(topic)

        # Забезпечуємо мінімум diversity: додаємо статті з інших тем
        if len(result) > 5:
            top_topics = set(list(topic_counts.keys())[:2])
            non_top_in_result = sum(1 for item in result if item.get('topic') not in top_topics)
            diversity_actual = non_top_in_result / len(result)

            if diversity_actual < diversity_floor:
                # Вставляємо статті з неохоплених тем
                for item in scored[len(result):]:
                    if item.get('topic') not in top_topics:
                        result.insert(len(result) // 2, item)  # Вставка в середину
                        if sum(1 for i in result if i.get('topic') not in top_topics) / len(result) >= diversity_floor:
                            break

        return result[:max_items]


class EngagementTracker:
    """Відстеження поведінки читача для оновлення профілю"""

    def update_profile_from_session(self, user_profile: dict,
                                     session_events: list[dict]) -> dict:
        """Інкрементальне оновлення профілю на основі сесії"""
        profile = user_profile.copy()
        topics = dict(profile.get('topics', {}))

        for event in session_events:
            topic = event.get('topic', 'general')
            action = event.get('action')
            value = event.get('value', 0)

            if action == 'completed_read':
                topics[topic] = topics.get(topic, 0) + 0.3
            elif action == 'quick_skip':
                topics[topic] = max(0, topics.get(topic, 0) - 0.1)
            elif action == 'share':
                topics[topic] = topics.get(topic, 0) + 0.5
            elif action == 'dislike':
                topics[topic] = max(0, topics.get(topic, 0) - 0.3)

        # Нормалізація
        total = sum(topics.values())
        if total > 0:
            profile['topics'] = {t: w / total for t, w in topics.items()}

        return profile

Процес роботи

Аналітика — аудит поточного фіду, збір даних (історія читання, події), визначення бізнес-цілей.
Проектування — обираємо архітектуру, конфігурацію векторизатора, метрики якості (NDCG, coverage).
Реалізація — пишемо NewsPersonalizationEngine, EngagementTracker, API, інтеграцію з вашим стеком.
Тест — A/B-тест на 10% трафіку, моніторинг p99 latency, порівняння з baseline.
Деплой — розгортання через Docker + Kubernetes, налаштування CI/CD для частих оновлень моделі.

Зв'яжіться з нами для демонстрації роботи алгоритму на ваших даних. Замовте передпроектне дослідження — ми проаналізуємо ваш фід за 5 робочих днів і надамо roadmap.

Що входить у роботу

Архітектурна документація (ML System Design Doc)
Навчена модель з вагами та конфігами
REST API для ранжування з авторизацією
Дашборд моніторингу (MLflow, Grafana)
Навчання вашої команди основам експлуатації
Підтримка 3 місяці після впровадження

Строки орієнтовно

MVP (базовий фід з профілем): від 2 місяців, вартість від $30,000
Повноцінна система (з diversity, cold start, трекінгом): від 4 до 6 місяців, вартість від $80,000 до $150,000
Економія на ретеншн-активностях може сягати $50,000–$100,000 на рік для великих проектів

Наші інженери мають сертифікати PyTorch та AWS SageMaker, а сукупний досвід команди у AI/ML перевищує 10 років. Ми реалізували 15+ проектів з персоналізації для новинних агрегаторів, соціальних мереж та e-commerce. Гарантуємо стабільність моделі в продакшені: SLA по latency p99 < 100ms. Отримайте консультацію: ми оцінимо ваш проект і запропонуємо оптимальну архітектуру.

Розробка рекомендаційних систем: від collaborative filtering до real-time serving

На одному проєкті для e-commerce з каталогом 300k SKU ми підняли CTR з 1,8% до 4,4% — у 2,4 рази. Перший ривок дала колаборативна фільтрація замість «популярне за останні 7 днів», другий — додавання контентних ознак та re-ranking. Різниця між «показуємо популярне» і «показуємо персоналізоване» — вимірна та суттєва. Нижче — інженерний досвід, який допоміг це зробити, і архітектури, які реально працюють у продакшені.

Collaborative Filtering: матрична факторизація та нейронні підходи

Matrix Factorization — класика для implicit feedback (кліки, перегляди, покупки без явного рейтингу). ALS (Alternating Least Squares) у бібліотеці Implicit обробляє матриці user×item із сотнями мільйонів ненульових значень за хвилини на GPU. Latent factors 64–256, регуляризація λ=0.01–0.1 — стартові параметри. Проблема cold start: для нового користувача або товару немає історії — класичний CF безпорадний, потрібні контентні ознаки або гібрид.

Neural Collaborative Filtering (NCF) замінює скалярний добуток на нейромережу. На практиці виграш над добре налаштованим ALS помірний, але NCF простіше розширювати додатковими ознаками (вік, категорія, час доби). Sequence-aware моделі (SASRec, BERT4Rec) враховують порядок взаємодій — state-of-the-art для сесійних рекомендацій.

Як вибрати архітектуру рекомендаційної системи?

Відповідь залежить від даних, навантаження та вимог до холодного старту. Нижче — три основні підходи з критеріями вибору.

Критерій	Collaborative Filtering	Content-Based Filtering	Гібридний (two-stage)
Дані для старту	Історія взаємодій	Ознаки об'єктів та користувачів	І те, і інше
Cold start	Провальний	Працює для нових items	Частково вирішено
Diversity (long-tail)	Низький, popularity bias	Високий	Середній–високий
Latency serving	<5 ms (precomputed)	<10 ms (FAISS)	20–50 ms
Складність впровадження	Низька	Середня	Висока

Гібридна архітектура на 20–40% ефективніша за чистий CF за покриттям long-tail — перевірено на каталогах від 100k SKU.

Content-Based Filtering: коли історії взаємодій мало

Content-based рекомендує на основі характеристик товарів, а не поведінки інших користувачів — вирішує cold start для нових items. Текстові ембединги через sentence-transformers (multilingual-e5-base, BGE-M3) → пошук схожих через FAISS IndexFlatIP — запит за <5 ms на 100k товарів. Item2Vec (Word2Vec на послідовностях переглядів) дає інтерпретовані «схожі товари» за пару годин навчання.

Структуровані ознаки (категорія, бренд, ціна) подаються через embedding layers або в gradient boosting — CatBoost працює з категоріями без ручного кодування.

Чому гібридні моделі працюють краще?

Production-системи майже завжди дворівневі. Stage 1 (Retrieval) — швидкий відбір 100–500 кандидатів із 300k товарів через ALS або Two-Tower модель з векторним пошуком (FAISS, Qdrant). Stage 2 (Ranking) — важкий ранжувальник на LightGBM або нейромережі з cross-features, часом, пристроєм та контекстом сесії. LightFM — хороша відправна точка для середнього масштабу без важкої інфраструктури. Наша практика показує: перехід від single-stage до two-stage дає приріст точності на 15–25% при зростанні latency всього на 20–30 мс.

Real-Time Serving: архітектура під навантаження

Latency SLA — 50–100 ms при тисячах запитів на секунду. Base-рекомендації precompute (batch job раз на годину) → Redis по user_id → <5 ms. Real-time re-ranking через Kafka для подій (кліки, додавання в кошик) → оновлення контекстних ознак. Feature serving — Redis з TTL (кількість переглядів за 24 години, останній клікнутий item). При навантаженні 10k req/s ставимо Redis Cluster з реплікацією.

A/B тестування — єдиний достовірний спосіб оцінити покращення. Офлайн-метрики корелюють з онлайн не завжди. Kohavi et al., «Online Controlled Experiments at Large Scale» (KDD 2013) — обов'язкове читання для команди. Тест з 5–10% трафіку, моніторинг CTR, конверсії, revenue per session. Одна з наших клієнтських систем після гібридизації збільшила виручку на 18% за місяць A/B.

Терміни розробки рекомендаційної системи

Етапи та типові часові витрати — у таблиці нижче. Вартість розраховується індивідуально під масштаб каталогу та вимоги до latency.

Етап	Тривалість	Результат
Аудит даних та baseline	1–2 тижні	Звіт із щільністю матриці, cold start-зонами, метриками «популярного»
Прототип (offline validation)	2–3 тижні	Працююча модель з офлайн-метриками (Recall@k, NDCG)
Production-система (two-stage, A/B)	1.5–2.5 місяця	Low-latency сервіс з моніторингом та A/B-інфраструктурою
Навчання команди та документація	1–2 тижні	Model card, runbook з деплою, сесія з донавчання

Що входить у розробку під ключ

Аудит даних — щільність матриці user×item (зазвичай <0,1%), розподіл активності, temporal паттерни, cold start статистика.
Baseline — «популярне» як простий поріг, який часто важко перевершити.
Ітеративне покращення — ALS → контентні ознаки → two-stage → sequence-aware. Кожен крок з A/B.
Інфраструктура serving — batch precomputation, Redis, real-time re-ranking, моніторинг у Grafana.
Документація — model card з метриками, інструкція з деплою, опис ознак.
Навчання команди — сесія з інтерпретації результатів та донавчання моделі.
Підтримка — 1 місяць після запуску (фікс інцидентів, доналаштування pipeline).

Ми — команда з 7+ роками досвіду в рекомендаційних системах, реалізували понад 30 проєктів для e-commerce та медіа. Гарантуємо прозоре A/B-тестування та фіксацію покращення метрик.

Хочете оцінити потенціал зростання вашого каталогу? Зв'яжіться з нами для безкоштовного аудиту даних. Замовте розробку рекомендаційної системи — перший прототип протягом двох тижнів.

Приклад конфігу ALS для implicit feedback

from implicit.als import AlternatingLeastSquares

model = AlternatingLeastSquares(
    factors=64,
    regularization=0.05,
    iterations=15,
    use_gpu=True
)
model.fit(user_item_matrix)

Більше про математику рекомендаційних систем — у Wikipedia.