Що таке churn prediction?

Churn prediction — задача машинного навчання, спрямована на виявлення клієнтів з високим ризиком припинення використання продукту. Модель аналізує історичні дані (RFM, поведінкові фічі, тікети підтримки) і присвоює кожному ймовірність відходу. Це дозволяє бізнесу проактивно утримувати клієнтів.

Які алгоритми найкраще підходять для прогнозування відтоку?

Для табличних даних оптимальні градієнтні бустинги — LightGBM, XGBoost, CatBoost. LightGBM дає гарний баланс швидкості та точності. Якщо важлива послідовність подій (наприклад, зниження активності за останні 30 днів), варто додати LSTM або Transformer.

Як боротися з незбалансованими класами в churn prediction?

Типове співвідношення 5-10% тих, хто йде, до 90% тих, хто залишається. Використовуйте class weights, SMOTE або Focal Loss. Головна порада — оптимізуйте поріг класифікації за Precision-Recall curve, а не використовуйте 0.5 за замовчуванням.

Скільки часу займає впровадження churn prediction?

Перша baseline-модель з RFM-фічами — 2-3 тижні. Повноцінна система з feature store, моніторингом дрейфу та інтеграцією в CRM — 8-10 тижнів. Терміни можуть варіюватися залежно від якості даних та складності інтеграції.

Як виміряти бізнес-ефект від моделі відтоку?

Найкращий спосіб — uplift modeling. Проведіть A/B тест: випадково оберіть 50% клієнтів з high-risk сегменту та застосуйте до них утримання, інші 50% — контроль. Різниця в churn rate між групами покаже реальний ефект.

Що таке churn prediction?

Churn prediction — задача машинного навчання, спрямована на виявлення клієнтів з високим ризиком припинення використання продукту. Модель аналізує історичні дані (RFM, поведінкові фічі, тікети підтримки) і присвоює кожному ймовірність відходу. Це дозволяє бізнесу проактивно утримувати клієнтів.

Які алгоритми найкраще підходять для прогнозування відтоку?

Для табличних даних оптимальні градієнтні бустинги — LightGBM, XGBoost, CatBoost. LightGBM дає гарний баланс швидкості та точності. Якщо важлива послідовність подій (наприклад, зниження активності за останні 30 днів), варто додати LSTM або Transformer.

Як боротися з незбалансованими класами в churn prediction?

Типове співвідношення 5-10% тих, хто йде, до 90% тих, хто залишається. Використовуйте class weights, SMOTE або Focal Loss. Головна порада — оптимізуйте поріг класифікації за Precision-Recall curve, а не використовуйте 0.5 за замовчуванням.

Скільки часу займає впровадження churn prediction?

Перша baseline-модель з RFM-фічами — 2-3 тижні. Повноцінна система з feature store, моніторингом дрейфу та інтеграцією в CRM — 8-10 тижнів. Терміни можуть варіюватися залежно від якості даних та складності інтеграції.

Як виміряти бізнес-ефект від моделі відтоку?

Найкращий спосіб — uplift modeling. Проведіть A/B тест: випадково оберіть 50% клієнтів з high-risk сегменту та застосуйте до них утримання, інші 50% — контроль. Різниця в churn rate між групами покаже реальний ефект.

Churn Prediction: ML-модель прогнозування відтоку клієнтів

Проектуємо та впроваджуємо системи штучного інтелекту: від прототипу до production-ready рішення. Наша команда поєднує експертизу в машинному навчанні, дата-інжинірингу та MLOps, щоб AI працював не в лабораторії, а в реальному бізнесі.

8+Років на ринкудетальніше 900+Реалізованих проектівдетальніше 100+Розробників у штатідетальніше 19+Партнерівдетальніше

Послуги, які ми пропонуємо

Показано 1 з 1Усі 1564 послуг

Churn Prediction: ML-модель прогнозування відтоку клієнтів

Середній

~1-2 тижні

Часті запитання

Напрямки AI-розробки

Обговорити AI-проект

Безкоштовна консультація — розповімо, як AI вирішить вашу задачу

Оцінити вартість

Розрахуємо бюджет та терміни вашого AI-проекту

Етапи розробки AI-рішення

Останні роботи

Розробка сайту компанії B2B ADVANCE
1348
Розробка веб-додатків для компанії FEEDME
1247
Розробка веб-сайту для компанії БЕЛФІНГРУП
949
Розробка інтернет магазину для компанії FURNORO
1183
Розробка логотипу компанії B2B Advance
642
Розробка веб-додатків для компанії Enviok
921

Показати більше робіт

Ми зіткнулися з задачею: у SaaS-продукту з $1M MRR відтік (churn) становив 5% на місяць. Кожен відсоток зниження — це $120K додаткового ARR на рік. Але без точної моделі утримання перетворюється на стрільбу наосліп: знижки всім підряд спалюють маржу. Churn prediction вирішує це — модель виявляє клієнтів з високим ризиком відходу до того, як вони підуть. Ми будуємо систему, яка на практиці знижує відтік на 20%.

Проблеми, які вирішуємо

Розмитий таргет. У non-contractual сценаріях (e-commerce, ігри) немає явної позначки відходу — потрібно визначити поріг неактивності. Наприклад, якщо клієнт не здійснював покупку 90 днів — вважаємо таким, що пішов. Вибір порогу критичний: при 30 днях позначка є у 20% клієнтів, при 90 — у 5%.

Незбалансовані класи. 2-10% тих, хто йде, проти 90% тих, хто залишається. Без корекції модель дає 90% accuracy, але нульовий recall по тих, хто йде.

Feature engineering. RFM-метрики — основа, але потрібні ще тренди (зміна активності за 30 днів), adoption rate функцій, тікети підтримки. Ми використовуємо rolling window агрегації та diff-фічі. Наш підхід включає Optuna для гіперпараметричної оптимізації та Stratified K-Fold крос-валідацію для стабільності.

Як ми це робимо: стек та кейс

Стек: LightGBM (baseline) — LightGBM в 10 разів швидший за LSTM на табличних даних при порівнянній якості. CatBoost для категоріальних фіч, LSTM якщо критична послідовність подій. Logistic Regression поступається LightGBM на 15–25% за AUC-ROC. Feature store — PostgreSQL з pgvector для ембеддінгів. MLflow для експериментів, SHAP для інтерпретації.

Розгорнутий кейс з нашої практики: Наш клієнт — B2B SaaS з 50K юзерів. Baseline LightGBM дав PR-AUC 0.31. Після додавання trend features (зміна частоти логінів за 30 днів) — 0.41, +32%. Додавання sequence моделі (LSTM на послідовностях подій) підняло до 0.49, але з 4x latency. В результаті продакшн — ансамбль LightGBM + LSTM з каскадним скорингом.

Як визначити відтік у non-contractual сценарії?

Визначте пороговий період неактивності, після якого клієнт вважається таким, що пішов. Ми вибираємо X на основі аналізу розподілу інтервалів між покупками. Типові значення: 60-90 днів для B2B SaaS, 90-180 для e-commerce. Невірний вибір веде до шуму в цільовій змінній.

Чому LightGBM — хороший baseline для churn prediction?

LightGBM стійкий до пропусків, працює з категоріями (при правильному кодуванні), враховує нелінійні залежності. На стандартних задачах відтоку він випереджає логістичну регресію за AUC-ROC на 0.15–0.25 і при цьому швидший за XGBoost в 2-3 рази.

Розробка та розгортання моделі

Feature Engineering

RFM-метрики (найважливіші предиктори):

Recency: днів з останньої дії/транзакції
Frequency: кількість сесій/покупок за 30/90/180 днів
Monetary: сума витрат за період

Поведінкові фічі:

Trend features: зростання/зниження активності за останні 30 днів vs. попередні 30
Feature adoption rate: який % ключових функцій продукту використовує клієнт
Support tickets: кількість звернень, тип, NPS після вирішення

Контрактні/демографічні:

Термін з моменту онбордингу
Тип тарифного плану
Сегмент (SMB / Enterprise)
Канал залучення

Вибір алгоритму

Алгоритм	Коли використовувати	Точність	Інтерпретованість
Logistic Regression	Baseline, потрібна інтерпретованість	Середня	Висока
LightGBM / XGBoost	Табличні дані, немає time series	Висока	Середня (SHAP)
CatBoost	Багато категоріальних фіч	Висока	Середня
LSTM / Transformer	Послідовності подій важливі	Дуже висока	Низька

Рекомендація: почати з LightGBM як baseline, додати Sequence Model якщо поведінкові патерни важливі.

Робота з незбалансованими класами

Методи боротьби з дисбалансом включають використання class weights (class_weight='balanced' в sklearn) — найпростіший fix; SMOTE генерує синтетичні приклади minority класу, але може внести шум; Focal Loss в нейромережах downweights easy examples; підбір порогу класифікації по Precision-Recall curve (не 0.5) — безкоштовний спосіб підвищити Precision@K. Для оцінки використовуємо F1-score (зважений) як основну метрику, AUC-ROC для ранжування, Precision@K для маркетингу — точність серед топ-K клієнтів за ризиком найбільш важлива.

Deployment та використання

Batch scoring: щотижневий запуск моделі по всій клієнтській базі. Результат — таблиця з churn probability для кожного клієнта. Сегментація: high risk (>0.7), medium risk (0.4-0.7), low risk (<0.4).

Real-time scoring: API endpoint POST /score, <100 мс відповідь, оновлення скора в CRM в реальному часі. Наше рішення SaaS Churn Prediction інтегрується з будь-якою CRM та забезпечує ML деплой моделі відтоку з мінімальними затримками.

Утримання за сегментами:

High risk: особистий дзвінок від Customer Success або знижка
Medium risk: автоматизована email-кампанія з value reminder
Low risk: без дій (не витрачати ресурси)

Оцінка бізнес-ефекту

Uplift modeling — правильний спосіб виміряти реальну цінність системи. Звичайний A/B тест: 50% high-risk клієнтів отримують утримання (treatment), 50% — ні (control). Вимірюємо різницю в churn rate. Компанії, що використовують churn prediction, знижують відтік на 15-20%. Середня економія від впровадження — $30–50K на 10K клієнтів. При базі 50 000 клієнтів економія від зниження відтоку на 20% становить $600 000 ARR. Інвестиція в $50 000 на впровадження приносить $500 000 додаткового ARR.

Процес і терміни робіт

Процес роботи

Аналітика: збір та очищення даних, визначення churn-визначення, аналіз розподілу.
Feature engineering: RFM, тренди, адопшен фіч, контрактні дані.
Моделювання: baseline (LightGBM), експерименти (CatBoost, LSTM), підбір порогів.
Тестування: offline (AUC, F1, Precision@K), online A/B uplift test.
Деплой: batch scoring weekly, real-time API (<100ms), інтеграція з CRM.
Моніторинг: дрейф даних, дрейф моделі, автоматичний перезапуск.

Що входить в роботу

Звіт з визначення churn (вибір таргету)
Baseline-модель (LightGBM) + SHAP-звіт
Документація фіч та пайплайну
Інтеграція batch scoring у вашу CRM
Навчання команди (2 години)
Підтримка 3 місяці після деплою

Терміни орієнтовно

Перша модель з базовими RFM-фічами — 2-3 тижні. Повноцінна система з feature store, моніторингом дрейфу та CRM-інтеграцією — 8-10 тижнів. Ми — команда з 5+ років досвіду в ML-продакшені, 30+ успішних проєктів з churn prediction. Наша команда сертифікована за стандартами AWS Machine Learning Specialty та має досвід роботи з клієнтами з оборотом $10M+. Ми гарантуємо якість деплою та надаємо підтримку 24/7. Зв'яжіться, щоб ми оцінили ваш проєкт і запропонували точні терміни. Отримайте консультацію щодо впровадження churn prediction.

Приклад коду для розрахунку RFM-фіч

import pandas as pd

def rfm_features(transactions, as_of_date):
    """Розрахунок Recency, Frequency, Monetary для кожного клієнта."""
    rfm = transactions.groupby('customer_id').agg(
        recency=('transaction_date', lambda x: (as_of_date - x.max()).days),
        frequency=('transaction_id', 'nunique'),
        monetary=('amount', 'sum')
    ).reset_index()
    return rfm

Які проблеми прогнозування часових рядів зустрічаються найчастіше?

Фінансовий директор запитує прогнозування часових рядів продажів на квартал. Аналітик будує SARIMA, досягає MAPE 8.3% на тестовій вибірці — і з гордістю деплоїть. Через два місяці в production метрика падає до 23%. Причина класична: модель навчалася на даних до COVID, тестувалася на стабільному періоді, а production потрапив на промо-акцію та збій поставок. Data leakage + distribution shift = гарні цифри в ноутбуці та непрацюючий прогноз в реальності. Ми стикалися з цим десятки разів. Наш досвід — 5+ років у прогнозуванні часових рядів для рітейлу, фінтеху та IoT, більше 50 завершених проєктів.

Неправильна крос-валідація. Стандартний train_test_split для часових рядів — помилка. Випадкове розбиття створює data leakage: модель бачить «майбутні» значення в навчанні. Правильно — TimeSeriesSplit або walk-forward validation з expanding window.

Множинна сезонність. Погодинні дані споживання електроенергії мають три сезонності: добову (24 год), тижневу (168 год), річну (8760 год). SARIMA справляється лише з однією. Prophet обробляє кілька, але повільно масштабується на тисячі рядів.

Пропуски та аномалії в даних. Пропуск у сенсорних даних — це інформація (датчик відключився), а не просто NaN. Лінійна інтерполяція вбиває цей сигнал. Правильна обробка залежить від природи пропуску.

Cold start при ієрархічному прогнозуванні. Новий SKU в асортименті з 50 000 позицій: історичних даних немає, потрібен прогноз. Стандартні підходи тут не працюють — потрібні cross-learning підходи або feature-based методи.

Які інструменти і коли застосовувати?

Prophet (Meta) — чудовий старт для бізнес-даних із зрозумілою сезонністю та святами. Швидко налаштовується, інтерпретований, вбудована обробка викидів і пропусків. Падає в точності при нерегулярних патернах і не масштабується на десятки тисяч рядів без паралелізації. Prophet (Facebook) — офіційна документація.

Gradient boosting на фічах (LightGBM, XGBoost) — часто недооцінений підхід. Створюєте фічі вручну: лаги (t-1, t-7, t-28), ковзні середні, категоріальні ознаки (день тижня, місяць), екзогенні змінні. Модель навчається на всіх рядах одночасно — вирішує cold start через схожі ряди. MAPE на рітейл-прогнозуванні часто кращий за нейронні мережі при правильній feature engineering.

TFT (Temporal Fusion Transformer) — трансформер, спеціально розроблений для інтерпретованого прогнозування з коваріатами. Вбудовані механізми: variable selection (які ознаки важливі), temporal self-attention (які часові точки впливають на прогноз), квантильні передбачення. Доступний у pytorch-forecasting. Вимагає ~10 000+ записів на ряд для стабільного навчання. Temporal Fusion Transformer — академічна публікація.

PatchTST — трансформер, який ділить часовий ряд на патчі (аналогічно ViT для зображень). Краще захоплює локальні патерни, ніж класичні трансформери. Добре працює для long-horizon forecasting (прогноз на 96–720 кроків). Реалізація в neuralforecast від Nixtla.

N-HiTS, N-BEATS — нейронні архітектури без attention, швидші за TFT, конкурентна точність. N-BEATS виграє на M4/M5 benchmark для задач без коваріат.

Метод	Коваріати	Масштаб (рядів)	Інтерпретованість	Складність
Prophet	Так (регресори)	До 10k	Висока	Низька
LightGBM + фічі	Так	100k+	Середня	Середня
TFT	Так	1k–100k	Висока	Висока
PatchTST	Ні/обмежено	Будь-який	Низька	Середня
N-HiTS	Ні	Будь-який	Низька	Низька

Як ми розгортаємо TFT в production?

TFT потребує ретельної підготовки даних. Типовий пайплайн через pytorch-forecasting:

training = TimeSeriesDataSet(
    data,
    time_idx="time_idx",
    target="sales",
    group_ids=["store", "sku"],
    min_encoder_length=max_encoder_length // 2,
    max_encoder_length=max_encoder_length,  # 120 днів
    min_prediction_length=1,
    max_prediction_length=max_prediction_length,  # 28 днів
    static_categoricals=["store_type", "category"],
    time_varying_known_reals=["price", "promo_flag"],
    time_varying_unknown_reals=["sales"],
    target_normalizer=GroupNormalizer(groups=["store", "sku"], transformation="softplus"),
)

Часта помилка: target_normalizer за замовчуванням (StandardScaler) ламає передбачення для рядів з нульовими значеннями (немає продажів у вихідні). GroupNormalizer з transformation="softplus" — правильний вибір для count-даних.

Покрокова інструкція з налаштування TFT

Збір та підготовка даних. Обробити пропуски (маркувати NaN, інтерполювати лише якщо це технічний збій), агрегувати до потрібної частоти, сформувати коваріати (свята, промо, ціни).
Створення TimeSeriesDataSet. Вказати group_ids (наприклад, магазин+SKU), часовий індекс, горизонт прогнозу. Налаштувати target_normalizer з урахуванням розподілу таргета.
Навчання baseline. Спочатку Prophet або LightGBM — щоб зрозуміти, наскільки складніше завдання.
Тренування TFT. Запустити TemporalFusionTransformer з loss=QuantileLoss(), підібрати learning rate та розміри hidden шарів. Використовувати pytorch_forecasting або neuralforecast.
Валідація та інтерпретація. Перевірити walk-forward, проаналізувати variable selection, побудувати attention heatmap.

Кейс: прогноз попиту в рітейлі. Мережа з 120 магазинів, 8000 SKU, горизонт прогнозу 28 днів. Вихідна система: SARIMA окремо для кожного ряду, MAPE 18.4%, повний цикл перенавчання — 6 годин. TFT на PyTorch + pytorch-forecasting: одна модель на всі ряди, MAPE 11.2%, перенавчання — 40 хв на A10G. Додатковий бонус: feature importance через variable selection — з'ясувалося, що day_before_holiday впливає сильніше, ніж сама дата свята. Середня економія бюджету на інференсі для клієнта склала значну суму.

Як правильно оцінювати якість прогнозів?

Не використовуйте RMSE як єдину метрику — вона сильно штрафує за великі помилки на великих значеннях. Наш набір метрик для рітейл-прогнозування:

MAPE — інтерпретована, але нестабільна при значеннях близьких до нуля
sMAPE — симетрична версія, уникає ділення на маленькі числа
MASE (Mean Absolute Scaled Error) — нормалізована відносно наївного сезонного прогнозу, чудово підходить для порівняння між рядами з різними масштабами
Quantile loss / Pinball loss — для ймовірнісного прогнозування, оцінка покриття інтервалів

Метрика	Коли використовувати	Недолік
MAPE	Бізнес-звітність, ряд без нулів	Нестабільна при малих значеннях
sMAPE	Порівняння моделей, нульові значення	Асиметрична інтерпретація
MASE	Різномаштабні ряди, бенчмарки	Вимагає сезонного наївного прогнозу
Pinball loss	Ймовірнісні моделі, управління запасами	Багато метрик для різних квантилів

Гарантуємо: ми надаємо model card з цими метриками на валідаційній вибірці та результати walk-forward тесту на історії не менше 6 місяців.

Що входить в роботу

Документація щодо обраної архітектури, обґрунтування вибору гіперпараметрів.
Відтворюваний пайплайн навчання та інференсу (Docker + CI/CD + Airflow/Prefect).
Код з коментарями та модульними тестами на ключові компоненти.
Навчання вашої команди: як перенавчати модель, як інтерпретувати виходи, як деплоїти нові версії.
Підтримка протягом 3 місяців після здачі: консультації, виправлення багів, доналаштування.

Деталі пайплайну інференсу

Модель деплоїться через FastAPI або Triton Inference Server. Перенавчання запускається за розкладом (наприклад, раз на тиждень) через Airflow — з валідацією drift та автоматичним відкатом при погіршенні метрик.

Процес роботи

Починаємо з EDA: візуалізація, тест ADF на стаціонарність, STL-декомпозиція, аналіз пропусків та викидів. Це 2–3 дні, але часто виявляє системні проблеми даних, які блокують прогнозування.

Потім: baseline (наївний seasonal, Prophet), feature engineering для LGBM, вибір архітектури нейронної мережі якщо потрібно. Walk-forward validation з реалістичним горизонтом. Деплой через API з автоматичним перенавчанням за розкладом через Airflow або Prefect.

Строки орієнтовно: MVP-прогноз на одному типі даних — 3–6 тижнів. Ієрархічна система прогнозування з автоматизацією — 2–5 місяців. Вартість розраховується індивідуально.

Наша команда — сертифіковані ML-інженери (AWS ML Specialty, GCP Professional ML Engineer). За 5 років на ринку реалізували понад 50 проєктів з прогнозування. Зв'яжіться з нами для безкоштовного аналізу ваших даних — ми оцінимо завдання та дамо перші рекомендації за 1–2 дні. Замовте консультацію і переконайтеся, що ваші прогнози працюють в production, а не тільки в ноутбуці.