Реалізація AI-передбачення LTV користувача у мобільному додатку
LTV (Lifetime Value) — гроші, які користувач принесе за все час життя у продукті. Знати його передбачене значення на 3-й день після встановлення означає можливість приймати рішення про UA-видатки на когорту з доказовою базою, а не на інтуїцію.
Зачем передбачувати LTV заздалегідь
Реальний LTV рахується постфактум — через 12–24 місяці. До тих пір ви вже витратили бюджет на залучення. Predicted LTV на основі поведінки перших 7–14 днів дозволяє:
- Коректувати ставки в UA-кампаніях (більш цінним когортам — більший CPI)
- Сегментувати користувачів для персоналізованих офферів уже в onboarding
- Приймати рішення про pre-emptive churn prevention для високоцінних користувачів
Які моделі застосовуємо
BG/NBD (Beta Geometric / Negative Binomial Distribution) — класика для підписочних та трансакційних додатків. Моделює «коли користувач зробить наступну покупку» та «коли він стане неактивним» як незалежні процеси. Добре працює на даних з історією 30+ днів.
Pareto/NBD — більш точний варіант, особливо на перших 30–60 днях життя користувача.
ML-регресія (XGBoost, LightGBM) — працює краще, коли у тебе багато поведінкових ознак та нелінійні залежності. На практиці часто выигрує у параметричних моделей на мобільних даних, де поведінка неоднорідна.
Гібридний підхід: параметрична модель дає baseline, ML — покращує його з додаванням контекстуальних ознак.
Feature engineering
Трансакційна історія — основа. Ознаки для LTV-моделі:
- Кількість та сума покупок за перші 7/14/30 днів
- Міжпокупочний інтервал (IPT — Inter-Purchase Time): чим коротше, тим вище LTV
- Середній чек та його тренд
- Тип монетизації (single IAP, subscription, consumables) — передбачуємо по-різному
- Відклик на скидки: користувач, купивший тільки за промокодом, має інший LTV, ніж купивший за повною ціною
- Engagement: сесії, глибина використання
Дані про транзакції на iOS — через StoreKit / RevenueCat webhook. На Android — Google Play Developer API / RevenueCat. RevenueCat особливо зручний: єдиний webhook для обох платформ, нормалізовані подій (initial_purchase, renewal, cancellation, refund).
Когортний аналіз перед моделлю
Перед тим як строити передбачувальну модель, проведи когортний аналіз вручну. Побудуй retention-криві за тижнями для когорт за джерелом трафіку, датою встановлення, платформою. Це часто виявляє, що у тебе не один паттерн LTV, а три–чотири різних сегменти — й для кожного потрібна своя модель або хоча б окрема стратифікація.
Інтеграція результатів
Передбачене LTV зберігається в user_predicted_ltv(user_id, ltv_30d, ltv_90d, ltv_365d, segment, updated_at). Сегменти: L (low, < P33), M (medium), H (high, > P67).
UA-кампанії: експортуємо high-LTV сегмент у Custom Audiences Facebook / Google Ads для lookalike. Користувачі подібні на твоїх high-LTV — цільова аудиторія.
Персоналізація у додатку: H-сегмент бачить premium upsell раніше та з меншою скидкою (вони готові платити). L-сегмент — більш агресивний free trial для створення звички.
Розподіл support-ресурсів: H-сегмент при зверненні отримує пріоритетну відповідь. Технічно — тег у CRM через інтеграцію з Zendesk/Intercom.
Точність та моніторинг
Валідація: train на когортах до місяця M, тест — на когорті M+1, порівнюємо predicted vs actual LTV через 90 днів. RMSE та MAPE як метрики. Типовий MAPE хорошої моделі — 25–40% на горизонті 90 днів: передбачувати гроші складно.
Переобучення щоквартально, плюс при значимих змінах продукту (новий paywall, зміна цін).
Орієнтири за термінами
Базова LTV-модель з когортним аналізом та сегментацією — 3–4 тижні при наявності 6+ місяців трансакційних даних. Повна система з інтеграцією у UA-кампанії, персоналізацією та моніторингом — 8–12 тижнів. Вартість розраховується індивідуально.







