AI-система оценки страховых рисков
Актуарная наука существует давно, но традиционные страховые таблицы работают с агрегированными статистиками — возраст, пол, регион, тип объекта. ML открывает доступ к индивидуальным паттернам: как конкретный водитель ведёт машину, в каком состоянии конкретное здание, какова динамика здоровья конкретного застрахованного. Это меняет точность андеррайтинга на порядок.
Виды страховых рисков и ML-подходы
Автострахование (каско/ОСАГО). Телематические данные с OBD-устройства или смартфона: ускорения, торможения, скорость в поворотах, время суток езды, типичные маршруты. Классификация стиля вождения + регрессия вероятности ДТП. XGBoost на телематических фичах даёт Gini 0.45–0.55 vs. 0.25–0.30 у традиционных моделей.
Имущественное страхование. Спутниковые снимки для оценки состояния кровли, Computer Vision на фотографиях имущества (дефекты, состояние), геоданные для оценки рисков наводнения/пожара.
Страхование жизни и здоровья. Данные носимых устройств (с согласия застрахованного): активность, сон, ЧСС. NLP анализ медицинских записей. Предсказательные модели хронических заболеваний.
Андеррайтинг коммерческой недвижимости. Финансовая отчётность + данные об арендаторах + внешние данные (трафик, demographics района) → вероятность дефолта по кредиту под залог.
Глубокий разбор: телематика в автостраховании
Сырые телематические данные — это временны́е ряды ускорений с частотой 1–10 Гц. Задача: из 10 000 поездок построить «подпись» водителя и предсказать вероятность аварии.
Feature engineering критичен:
def extract_driving_features(trips: List[Trip]) -> dict:
all_accel = np.concatenate([t.acceleration for t in trips])
all_decel = np.concatenate([t.deceleration for t in trips])
return {
# Hard events
"hard_braking_rate": sum(a < -0.3g for a in all_decel) / len(trips),
"hard_acceleration_rate": sum(a > 0.3g for a in all_accel) / len(trips),
"harsh_cornering_rate": ...,
# Speed profile
"pct_time_speeding": ...,
"avg_speed_highway": ...,
# Context
"night_driving_pct": sum(t.is_night for t in trips) / len(trips),
"weekend_driving_pct": ...,
"avg_trip_duration_min": np.mean([t.duration for t in trips])
}
Deep learning подход: LSTM или Temporal CNN напрямую на последовательностях ускорений без feature engineering — работает, но интерпретировать для регулятора сложнее.
Fraud detection в страховании
Страховое мошенничество — 10–15% всех выплат в среднем по индустрии. ML-детекция на заявлениях о страховых случаях:
- Описание ущерба: NLP для выявления нестандартных формулировок, copy-paste из других заявлений, несоответствий внутри заявления
- Временны́е паттерны: заявления сразу после оформления полиса, частые небольшие заявления
- Граф связей: один адвокат/СТО/врач → много заявлений от разных клиентов (organised fraud ring)
- Сумма заявления: отклонение от статистической нормы для данного типа ущерба
GNN на графе «застрахованный — контрагент» даёт +15–20% recall по организованному мошенничеству по сравнению с tabular моделями.
Практический кейс
Страховщик КАСКО, 180 000 полисов. Задача: персонализированный тариф на основе телематики. Традиционная модель: тариф по возрасту + стаж + марка. Gini = 0.28.
После внедрения телематической ML-модели:
- 23 000 водителей подключили телематику за первые 4 месяца (скидка до 30% как стимул)
- Gini на телематической когорте: 0.51
- Убыточность в телематической когорте через год: на 18% ниже контрольной группы
- «Безопасные» водители получили скидку в среднем 22%
- «Рискованные» водители либо отказались от телематики (отрицательная селекция — тоже информация), либо скорректировали стиль вождения
Побочный эффект: частота ДТП в телематической когорте снизилась на 11% — водители меняют поведение, зная о мониторинге.
Регуляторные ограничения
В России страховые компании ограничены в использовании ряда признаков при тарификации. ЦБ РФ требует обоснования тарифных факторов. Система должна быть интерпретируемой: SHAP для объяснения тарифа конкретному клиенту. Данные телематики — персональные, требуют согласия по ФЗ-152.
Сроки: 8–14 недель для базовой скоринговой модели, 4–8 месяцев для полного решения с телематикой, fraud detection и compliance-документацией.







