Реалізація прогнозування LTV клієнта
Customer Lifetime Value — очікувана сума прибутку від клієнта за весь період взаємодії. Точна оцінка LTV дозволяє правильно інвестувати в привлечення (CAC), сегментувати базу та приоритизувати утримання. ML-підхід дає на 30-50% точніші прогнози, ніж прості історичні середні.
Два підходи до прогнозування LTV
Контрактні моделі (SaaS, підписки): Клієнт або активний, або вийшов. Задача розбивається на:
- Churn prediction: ймовірність виходу в кожен період
- Revenue prediction: розмір оплати при умові, що клієнт активний
- LTV = Σ P(alive at t) × Expected_Revenue(t) × Discount_Factor(t)
Non-contractual моделі (e-commerce, роздріб): Клієнт не повідомляє про вихід. Класичний підхід — BG/NBD модель (Beta Geometric/Negative Binomial Distribution):
- Frequency model: частота транзакцій = NBD
- Dropout model: ймовірність "смерті" клієнта = Beta-Geometric
- Monetary value model: гамма-гамма модель для середнього чеку
Бібліотека lifetimes (Python) реалізує BG/NBD + гамма-гамма з коробки. Дані: customer_id, frequency, recency, T (вік клієнта), monetary_value.
ML-підхід: пряме прогнозування
Альтернатива ймовірнісним моделям — пряме прогнозування 12-місячного LTV через регресію:
Фічи:
- RFM за перші 30/60/90 днів після онбордингу
- Канал привлечення (paid search, organic, referral)
- Когортні характеристики (сезон привлечення)
- Поведінкові: використання фіч, глибина сесій
- Сегмент: B2B vs. B2C, географія, розмір компанії
Алгоритм: LightGBM Regressor з квантильними втратами для невизначеності. Метрика: MAPE на holdout когорті (клієнти, онбординг яких був 12+ місяців тому).
Типова точність: MAPE 25-40% для 12-місячного прогнозу — достатньо для сегментації, але не для точного CAC-розрахунку.
Ранній предиктор LTV
Цінна деталь: прогнозувати LTV в перші 7-30 днів після реєстрації, коли даних мало:
Early Life Signals:
- Onboarding completion rate
- Кількість ключових дій в першу тиждень (product activation)
- NPS score з першого опитування
- Глибина використання: кількість модулів/фіч
Random Forest з цими фічами дозволяє класифікувати "whales" (високий LTV) з Precision 60-70% вже через 7 днів після реєстрації. Це дозволяє направити Customer Success на правильних клієнтів з перших днів.
Сегментація за LTV
Прогноз LTV → сегментація клієнтської бази:
| Сегмент | LTV Percentile | Стратегія |
|---|---|---|
| Champions | > 90th | VIP підтримка, референс-програми |
| High Potential | 70-90th | Активний CS, upsell |
| Core | 30-70th | Автоматизований nurturing |
| At Risk | < 30th | Watchlist, перевірка fit |
Сегменти переглядаються щокварталу або при значній зміні поведінки.
Оптимізація маркетингових витрат
Головне застосування LTV-моделі — CAC-оптимізація:
Bidding у paid channels:
- Google Ads / Meta Ads підтримують передачу predicted LTV як conversion value
- Smart Bidding оптимізує на максимізацію LTV, не ROAS
- Результат: зсув бюджету до каналів з кращим LTV/CAC ratio
Когортний аналіз: LTV за когортами привлечення (місяць × канал × кампанія) показує які кампанії привлекають клієнтів з реальною цінністю, а не просто дешевих.
Моніторинг моделі
LTV — довгостроковий прогноз, його складно валідувати швидко. Підходи:
- Shortened Horizon Validation: навчаємо на когорті 24 місяці, прогнозуємо 12-місячний LTV, порівнюємо з фактом через 12 місяців
- Relative Ranking Accuracy: важлива не абсолютна точність, а правильний порядок клієнтів за LTV
- Early vs. Final LTV Correlation: наскільки 7-денний LTV корелює з 12-місячним фактом
Строки: BG/NBD + гамма-гамма модель з lifetimes — 2-3 тижні. ML-система з early predictor, моніторингом та інтеграцією з CRM/paid channels — 10-14 тижнів.







