Реалізація прогнозування конверсії (Conversion Prediction)
Conversion prediction — це оцінка ймовірності цільової дії користувача в найближчий час: покупки, реєстрації, запиту демо, оформлення підписки. Точна модель дозволяє персоналізувати інтерфейс, оптимізувати рекламні ставки та приоритизувати роботу sales team.
Типи задач конверсії
E-commerce:
- Додавання в кошик → покупка (micro-conversion)
- Сесія → транзакція
- Email-розсилка → перехід та покупка
SaaS / B2B:
- Відвідувач сайту → реєстрація (freemium)
- Trial → Paid conversion
- MQL → SQL → Closed Won (pipeline conversion)
Marketplace / фінтех:
- Заявка → схвалення → видача продукту
- Перегляд оголошення → контакт з продавцем
Кожна задача має свою специфіку даних та часовий горизонт.
Feature Engineering за джерелами даних
Web analytics / clickstream:
- Кількість сесій та сторінок у поточній сесії
- Джерело трафіку (utm_source, utm_medium, utm_campaign)
- Пристрій, браузер, гео
- Глибина скролу на ключових сторінках
- Time spent на pricing / product pages
- Recency останнього візиту
Поведінкові паттерни:
- Sequence of page views: хто дивився /pricing → /case-studies → /demo конвертує в 3× вище
- Session velocity: прискорення активності (багато дій за короткий час — сильний сигнал)
- Return visitor patterns: 2-й та 3-й візит сильніші за перший
CRM / firmographic (B2B):
- Розмір компанії, галузь, географія
- Technology stack (дані BuiltWith, Clearbit)
- Intent data: пошукові запити компанії на G2, Capterra
Моделі та метрики
Для високочастотних e-commerce подій: LightGBM з click-stream features. Навчання на останніх 30-90 днях. Переквалікування щодня або щотижня.
Для B2B з довгим циклом: Survival analysis (Cox Proportional Hazards) — правильна постановка: прогнозуємо не факт конверсії, а час до конверсії. Логістична регресія або CatBoost з firmographic фічами як baseline.
Метрики:
- AUC-ROC: загальна якість ранжування
- Precision@K: точність на top-K% лідів (найважливіше для sales)
- Lift curve: у скільки разів модель краща за випадковий вибір
- Calibration: наскільки predicted probabilities відповідають реальним частотам
Real-time Персоналізація
На основі conversion score в реальному часі:
| Score | Дія на сайті |
|---|---|
| > 0.8 | Всплув "Поговоріть з менеджером" |
| 0.6-0.8 | Показ case study галузі компанії |
| 0.4-0.6 | Персоналізований CTA на pricing |
| < 0.4 | Стандартний контент |
Технічно: JavaScript SDK отправляє события в ML API → score < 200 мс → front-end рендерить персоналізований контент через React/Vue.
Pipeline у CRM
Для B2B: conversion score інтегрується в sales workflow:
- Salesforce / HubSpot: поле "Propensity to Buy" в об'єкті Lead
- Автоматична приоритизація черги дзвінків sales
- Тригер high-intent: score > 0.75 → автозавдання "Позвони протягом 1 години"
Дослідження показують: дзвінок high-intent лідові протягом 5 хвилин підвищує конверсію в 9× порівняно з дзвінком через 60 хвилин.
Attribution та зворотний зв'язок
Важливо правильно будувати training data — проблема attribution window:
- Conversion label повинна братися через фіксований час після події: 30 або 60 днів
- Нові дані без конверсій не можна включати в навчання до закінчення вікна
- Censored data (користувач ще активний, вікно не минуло) — обробляється окремо
Строки: базова logistic regression модель з web analytics даними — 2-3 тижні. Повноцінна система з real-time scoring API, персоналізацією та CRM-інтеграцією — 8-12 тижнів.







