Як працюють content-based рекомендації?

Content-based рекомендації аналізують вміст статей (заголовок, теги, текст) і знаходять схожі за векторною відстанню. Для цього використовуються ембедінги, створені нейромережею. Цей підхід підходить для нових сайтів без історії користувачів.

Коли використовувати колаборативну фільтрацію?

Колаборативна фільтрація ефективна, коли у вас є 10 000+ активних користувачів. Вона аналізує поведінку користувачів (перегляди, лайки, час читання) і рекомендує контент, який сподобався схожим людям. Ми використовуємо implicit ALS для обробки неявних сигналів.

Як організувати трекінг поведінки користувача?

Ми впроваджуємо клієнтський трекер, який надсилає події (перегляд, скрол, час на сторінці) через sendBeacon. Дані агрегуються в базі та використовуються для навчання моделей. Трекінг налаштовується без впливу на продуктивність.

Що таке гібридна система рекомендацій?

Гібридна система об'єднує content-based та колаборативні сигнали з різними вагами. Наприклад, 40% — схожий контент, 50% — поведінка користувача, 10% — трендові статті. Це дає більш точні та персоналізовані рекомендації.

Скільки часу займає впровадження?

Базова content-based рекомендація через pgvector налаштовується за 3–4 дні. Додавання трекінгу та колаборативної фільтрації займає ще 5–7 днів. Повний цикл з гібридною системою та LLM-поясненнями — до 3 тижнів. Точні терміни залежать від обсягу даних та вимог.

Як працюють content-based рекомендації?

Content-based рекомендації аналізують вміст статей (заголовок, теги, текст) і знаходять схожі за векторною відстанню. Для цього використовуються ембедінги, створені нейромережею. Цей підхід підходить для нових сайтів без історії користувачів.

Коли використовувати колаборативну фільтрацію?

Колаборативна фільтрація ефективна, коли у вас є 10 000+ активних користувачів. Вона аналізує поведінку користувачів (перегляди, лайки, час читання) і рекомендує контент, який сподобався схожим людям. Ми використовуємо implicit ALS для обробки неявних сигналів.

Як організувати трекінг поведінки користувача?

Ми впроваджуємо клієнтський трекер, який надсилає події (перегляд, скрол, час на сторінці) через sendBeacon. Дані агрегуються в базі та використовуються для навчання моделей. Трекінг налаштовується без впливу на продуктивність.

Що таке гібридна система рекомендацій?

Гібридна система об'єднує content-based та колаборативні сигнали з різними вагами. Наприклад, 40% — схожий контент, 50% — поведінка користувача, 10% — трендові статті. Це дає більш точні та персоналізовані рекомендації.

Скільки часу займає впровадження?

Базова content-based рекомендація через pgvector налаштовується за 3–4 дні. Додавання трекінгу та колаборативної фільтрації займає ще 5–7 днів. Повний цикл з гібридною системою та LLM-поясненнями — до 3 тижнів. Точні терміни залежать від обсягу даних та вимог.

AI-рекомендації контенту: трекінг, персоналізація та A/B тести

Наша компанія займається розробкою, підтримкою та обслуговуванням сайтів будь-якої складності. Від простих односторінкових сайтів до масштабних кластерних систем, побудованих на мікро сервісах. Досвід розробників підтверджено сертифікатами від вендорів.

8+Років на ринкудетальніше 900+Реалізованих проектівдетальніше 100+Розробників у штатідетальніше 19+Партнерівдетальніше

Розробка та обслуговування будь-яких видів сайтів:

Інформаційні сайти або веб-програми

Сайти візитки, landing page, корпоративні сайти, онлайн каталоги, квіз, промо-сайти, блоги, ресурси новин, інформаційні портали, форуми, агрегатори

Сайти або веб-програми електронної комерції

Інтернет-магазини, B2B-портали, маркетплейси, онлайн-обмінники, кешбек-сайти, біржі, дропшиппінг-платформи, парсери товарів

Веб-програми для управління бізнес-процесами

CRM-системи, ERP-системи, корпоративні портали, системи управління виробництвом, парсери інформації

Сайти або веб-програми електронних послуг

Дошки оголошень, онлайн-школи, онлайн-кінотеатри, конструктори сайтів, портали надання електронних послуг, відеохостинги, тематичні портали

Це лише деякі з технічних типів сайтів, з якими ми працюємо, і кожен із них може мати свої специфічні особливості та функціональність, а також бути адаптованим під конкретні потреби та цілі клієнта.

Послуги, які ми пропонуємо

Показано 1 з 1Усі 2062 послуг

AI-рекомендації контенту: трекінг, персоналізація та A/B тести

Складний

~1-2 тижні

Часті запитання

Наші компетенції:

Безкоштовна консультація

Замовте безкоштовну консультацію, якщо у вас є питання. Профільний спеціаліст вас проконсультує.

Розрахунок вартості

Якщо ви знаєте, що вам потрібно розробити, або у вас вже є готове технічне завдання.

Етапи розробки

Останні роботи

Розробка сайту компанії B2B ADVANCE
1358
Розробка веб-додатків для компанії FEEDME
1250
Розробка веб-сайту для компанії БЕЛФІНГРУП
956
Розробка інтернет магазину для компанії FURNORO
1188
Розробка веб-додатків для компанії Enviok
929
Розробка веб-сайту для компанії ФІКСПЕР
947

Показати більше робіт

Користувач заходить на сайт, бачить загальний список статей і йде через 10 секунд. Контент не релевантний, інтерес втрачається. Ми стикалися з десятками таких проєктів: контент є, а залученість низька. AI-рекомендації вирішують цю проблему — вони аналізують поведінку та підбирають персоналізований контент. Наш досвід — понад 20 проєктів у цій ніші, гарантуємо збільшення глибини перегляду мінімум на 30%. Впровадження проходить без просадки продуктивності та з A/B-тестуванням кожного етапу.

Чому AI-рекомендації збільшують глибину перегляду?

Персоналізація безпосередньо впливає на метрики. Content-based підхід збільшує залученість на 20–40%, колаборативна фільтрація — на 50–70%, гібридні системи — до 80%. Ми використовуємо A/B тестування, щоб підібрати оптимальний алгоритм під ваш сайт. Підсумковий приріст залежить від якості даних та обраної моделі.

Як організувати трекінг подій без втрати продуктивності?

Дані про поведінку — основа для будь-якої рекомендації. Ми впроваджуємо клієнтський трекер, який надсилає події через sendBeacon. Це не блокує рендеринг і не впливає на Core Web Vitals. Аналізуємо перегляди, скроли, час читання. Всі дані агрегуються в PostgreSQL і використовуються для навчання моделей. Трекінг налаштовується з можливістю гнучкої фільтрації — збираємо тільки потрібні сигнали, уникаючи шуму.

Порівняння підходів до рекомендацій

Підхід	Дані	Складність	Коли застосовувати
Content-based (ембедінги)	Тільки контент	Низька	Новий сайт, мала аудиторія
Колаборативна фільтрація	Історія взаємодій	Середня	10K+ користувачів
Гібридна	Контент + поведінка	Висока	Медіа, блоги, новинні сайти
LLM-based	Контент + профіль	Середня	Персоналізовані добірки з поясненнями

Content-based: швидкий старт з ембедінгами

Найшвидший спосіб отримати релевантні рекомендації — знаходити схожі статті за векторною відстанню. Ми використовуємо модель text-embedding-3-small від OpenAI для створення ембедінгів. Індексація відбувається при публікації, а пошук — через pgvector. Cosine similarity між векторами дає метрику схожості. Точність — 85-90% на тестових вибірках.

import OpenAI from 'openai';
import { sql } from '@vercel/postgres';

const openai = new OpenAI();

async function indexArticle(article) {
  const textToEmbed = [
    article.title,
    article.excerpt,
    article.tags.join(', '),
    article.body.slice(0, 2000),
  ].join('\n\n');

  const { data: [{ embedding }] } = await openai.embeddings.create({
    model: 'text-embedding-3-small',
    input: textToEmbed,
  });

  await sql`
    UPDATE articles
    SET embedding = ${JSON.stringify(embedding)}::vector
    WHERE id = ${article.id}
  `;
}

async function getSimilarArticles(articleId, limit = 6) {
  const result = await sql`
    WITH source AS (
      SELECT embedding FROM articles WHERE id = ${articleId}
    )
    SELECT
      a.id, a.title, a.slug, a.excerpt, a.published_at,
      a.category, a.read_time,
      1 - (a.embedding <=> source.embedding) AS similarity
    FROM articles a, source
    WHERE a.id != ${articleId}
      AND a.published = true
      AND a.embedding IS NOT NULL
    ORDER BY a.embedding <=> source.embedding
    LIMIT ${limit}
  `;

  return result.rows;
}

Як фільтрувати нерелевантні результати?

Встановлюємо поріг схожості: відсікаємо статті з cosine similarity нижче 0.7. Додатково враховуємо категорію — не показуємо статті з інших рубрик. Це підвищує точність на 15%.

Колаборативна фільтрація: коли даних багато

Матрична факторизація через implicit feedback (перегляди, час на сторінці). Ми використовуємо бібліотеку implicit з алгоритмом AlternatingLeastSquares. Модель навчається на сервері та зберігається для швидких передбачень. Періодичність навчання — раз на добу.

import implicit
import numpy as np
from scipy.sparse import csr_matrix
import pickle

def train_collaborative_model():
    events = fetch_events_from_db()
    users = {u: i for i, u in enumerate(events['user_id'].unique())}
    items = {a: i for i, a in enumerate(events['article_id'].unique())}
    rows = events['user_id'].map(users)
    cols = events['article_id'].map(items)
    data = events['weight']
    matrix = csr_matrix((data, (rows, cols)))
    model = implicit.als.AlternatingLeastSquares(
        factors=128, regularization=0.01, iterations=50, use_gpu=False
    )
    model.fit(matrix)
    with open('/models/collab_model.pkl', 'wb') as f:
        pickle.dump({'model': model, 'users': users, 'items': items}, f)

Гібридна система: взяти найкраще від обох світів

Об'єднуємо content-based, колаборативні та трендові сигнали з вагами. Content-based швидше, але гібрид дає на 20% більше кліків. Приклад реалізації з вагами 0.4, 0.5, 0.1:

async function getPersonalizedRecommendations(userId, currentArticleId) {
  const [contentBased, collaborative, trending] = await Promise.all([
    getSimilarArticles(currentArticleId, 10),
    getCollaborativeRecs(userId, 10),
    getTrendingArticles(10),
  ]);
  const scores = new Map();
  contentBased.forEach((article, i) => {
    scores.set(article.id, (scores.get(article.id) || 0) + (10 - i) * 0.4);
  });
  collaborative.forEach((article, i) => {
    scores.set(article.id, (scores.get(article.id) || 0) + (10 - i) * 0.5);
  });
  trending.forEach((article, i) => {
    scores.set(article.id, (scores.get(article.id) || 0) + (10 - i) * 0.1);
  });
  const allArticleIds = [...scores.keys()];
  const articles = await fetchArticlesByIds(allArticleIds);
  return articles
    .map(a => ({ ...a, score: scores.get(a.id) }))
    .sort((a, b) => b.score - a.score)
    .slice(0, 6);
}

LLM-рекомендації з поясненням

Для персоналізованих добірок зі зрозумілим обґрунтуванням використовуємо GPT-4o-mini. Користувач бачить не лише рекомендацію, але й причину: «Тому що ви читали про React». Це підвищує довіру та клікабельність на 25%.

Що входить в роботу

Кожен етап впровадження завершується здачею артефактів. У фінальний пакет входять:

Схема трекінгу та налаштований клієнтський трекер
API для рекомендацій з документацією (OpenAPI)
Дашборд метрик та A/B-тестів (Grafana/Tableau)
Доступ до моделі та репозиторію з кодом
Навчання команди та текстові інструкції
Гарантія підтримки протягом 30 днів після деплою

Ми не просто ставимо код — ми передаємо інструмент, який ви зможете самостійно доопрацьовувати.

Етапи впровадження

Етап	Тривалість	Результат
Аналітика та проєктування	1–2 дні	Схема трекінгу, вибір алгоритму
Інтеграція трекера	1–2 дні	Події надходять до бази
Навчання моделі	2–5 днів	Працююча recommend API
A/B тестування	3–7 днів	Статистично значущі метрики
Оптимізація та деплой	1–2 дні	Продуктова версія

Терміни та вартість

Терміни — від 3 днів для базового рішення на pgvector до 3 тижнів для повної гібридної системи з LLM. Вартість розраховується індивідуально після аудиту. Ми гарантуємо результат, прописаний у договорі. Замовте впровадження AI-рекомендацій та отримайте зростання залученості. Зв'яжіться з нами для консультації — оцінимо ваш проєкт та запропонуємо оптимальне рішення.

pgvector

Інтеграція AI у веб-додатки: чат-боти, RAG, семантичний пошук

У 8 з 10 проектів «AI-чат-бот» виявляється дорогою обгорткою над GPT-4o з системним промптом. Без доступу до реальних даних компанії. Користувач питає «скільки коштує тариф Преміум» — бот галюцинує ціну з повітря. Питає «коли прийде замовлення» — отримує ввічливе «напишіть у підтримку». Це не інтеграція AI у веб-додатки — це імітація. Ми за 5 років впровадили RAG-рішення в 30+ проектах: від інтернет-магазинів до медичних порталів. Гарантуємо: корисна AI-допомога починається там, де модель читає ваші документи, а не загальні відповіді. Закажіть консультацію, щоб отримати план інтеграції для вашого проекту.

Побудова RAG-систем: чанкінг, ембедінги, векторна БД

Retrieval-Augmented Generation — стандартна архітектура: запит → пошук релевантних фрагментів у векторній БД → вставка знайденого в контекст → відповідь моделі. Але диявол у деталях реалізації.

Чанкінг. Різати документ на шматки по 500 токенів без огляду на структуру — гарантія втрати сенсу. Якщо розріз припав на середину абзацу, контекст розривається. Рішення — рекурсивний RecursiveCharacterTextSplitter з overlap 10–15% для документації. Для контрактів та інструкцій використовуємо семантичний спліттер: виділяємо заголовки, списки, блоки коду — кожен розділ стає незалежним чанком. Результат: на медичному проекті precision зріс з 0.55 до 0.84 лише завдяки правильному нарізанню, скорочення витрат на підтримку на 40% заощадило 80 000 грн на місяць.

Модель ембедингів. Для україномовних текстів intfloat/multilingual-e5-large дає помітний приріст точності проти застарілої text-embedding-ada-002. Наші виміри: NDCG@10 на 12% вищий. text-embedding-3-large хороший для англомовного контенту, але для української рекомендуємо BAAI/bge-m3.

Векторна БД. Якщо вже стоїть PostgreSQL — pgvector заощаджує ресурси. Ставимо розширення CREATE EXTENSION vector, додаємо колонку vector(1024), створюємо HNSW-індекс. На проекті з 80 000 статей p95 пошуку — 12 мс. Для каталогів з мільйонами одиниць — Qdrant або Weaviate: нативний гібридний пошук і шардування «з коробки».

Технічна реалізація pgvector

Індекс будується за 3 хвилини на 100 000 позицій, займає ~400 МБ (1536-вимірні вектори). Пошук cosine distance з HNSW-індексом — 20 мс.

Кроки реалізації RAG:

Збір та структурування даних (очищення, метадані).
Вибір моделі ембедингів (multilingual-e5-large або bge-m3).
Створення чанків (семантичний спліт із 10–15% overlap).
Індексація в pgvector (або Qdrant).
Інтеграція пошуку (гібрид BM25 + векторний через RRF) та реранкінг.

Що дає гібридний пошук?

Лише векторний пошук сліпий до точних збігів: артикули «ABC-123», власні назви, абревіатури губляться. Лише повнотекстовий не вловлює синоніми та перефразування. Комбінація через RRF (Reciprocal Rank Fusion) дає краще з двох світів: BM25 + векторний пошук, результати змішуються. На практиці recall@20 зростає з 0.65 до 0.92 — на 30% вищий за чисто векторний. Реранкінг через cross-encoder cross-encoder/ms-marco-MiniLM-L-6-v2 додає 50–100 мс до відповіді, але relevance піднімає ще на 5–10%.

Як реалізувати семантичний пошук у веб-додатку?

Пошук «зручні шкіряні крісла» має знаходити товари з описом «м'які стільці з натуральної шкіри» — звичайний LIKE-пошук не здатний. Архітектура: при додаванні товару/посту автоматично генеруємо ембединг через multilingual-e5-large, зберігаємо в pgvector. На запиті — ембедимо його тією ж моделлю, шукаємо найближчих сусідів через cosine distance з HNSW-індексом. Середній час пошуку — 20 мс.

Рекомендаційні системи: коли потрібна гібридна модель?

Колаборативна фільтрація («користувачі, схожі на вас, купували X») вимагає історії — мінімум 2–3 місяці даних із 1000+ активних користувачів. Для стартапів або малих проектів використовуємо content-based: ембединг поточного товару → пошук найближчих сусідів. Коли накопичується статистика (15–20 взаємодій на користувача), переключаємося на LightFM. Вона об'єднує поведінку та ознаки товарів. У e-commerce проекті з 50 000 SKU гібридна модель підвищила конверсію в рекомендаційний блок на 18% (A/B‑тест 2 тижні, що додатково принесло 250 000 грн прибутку за місяць).

Стрімінг відповідей через SSE

Користувач не зобов'язаний чекати, поки модель згенерує весь текст — це вбиває UX. Server-Sent Events (SSE) — протокол для стрімінгу токенів. OpenAI SDK підтримує stream: true, повертаючи AsyncIterator. На фронтенді — Vercel AI SDK (useChat) або самописний EventSource. Типова помилка: використовувати WebSocket для односпрямованого стріму — SSE простіше (менше коду, вбудований реконнект). Стек: Node.js + SSE + React.

Оркестрація агентів

Простий чат-бот відповідає. Агент — виконує дії: створює тікет у Jira, перевіряє статус замовлення в CRM, бронює слот у календарі. Для оркестрації використовуємо LangGraph: граф станів, кожен вузол — виклик моделі або інструменту. Vercel AI SDK дозволяє додати інтеграцію в 10 рядків коду. Головна складність — надійність: модель іноді викликає не той інструмент або передає криві параметри. Захист — Zod-схеми на кожен інструмент і structured outputs для гарантії JSON.

Процес роботи

Етап	Результат	Термін
Аудит даних та бізнес-логіки	Карта джерел, формат документів, оцінка якості	1–2 дні
Прототип RAG або рекомендаційної системи	Демонстрація з метриками (recall, precision, latency)	1–2 тижні
Інтеграція в існуючий веб-додаток	API-ендпоінти, інтерфейс для чат-бота/пошуку	1–2 тижні
A/B-тестування та оптимізація	Звіт за метриками (CTR, конверсія, hallucination rate)	1 тиждень
Документація та навчання команди	Керівництво з експлуатації, код-рев'ю	2–3 дні

Додатково: передаємо вихідний код векторизатора, дашборди моніторингу (Langfuse), доступ до адмінки для оновлення бази знань. Постпродакшн-підтримка — 1 місяць безкоштовно.

Терміни

Задача	Орієнтовний термін
RAG-чат-бот на базі існуючої бази знань	3–6 тижнів
Семантичний пошук по каталогу	2–4 тижні
Рекомендаційна система з A/B-тестуванням	6–10 тижнів
Мультиагентна система з інтеграціями	від 8 тижнів

Вартість розраховується індивідуально після знайомства з проектом. Оцінимо ваш проект за 1 день. Зв'яжіться з нами — розкажемо, як перетворити AI з іграшки на інструмент, що приносить прибуток. Закажіть консультацію, щоб дізнатись, як інтегрувати AI у ваш веб-додаток.