Разработка AI-системы автоматизации compliance в финансовой отрасли
Финансовый compliance — ежедневный поток требований: AML-мониторинг, KYC обновление, МСФО отчётность, регуляторные запросы ЦБ. Ручные процессы не масштабируются: штат комплаенс-офицеров растёт линейно с объёмом операций. AI позволяет обрабатывать 10x–100x операций тем же числом сотрудников.
AML-мониторинг транзакций
Многослойная система обнаружения
Базовый уровень — правила ЦБ (сомнительные признаки по Положению 375-П):
- Операции с наличными >600 тыс. руб.
- Переводы физлицам в нерезидентные юрисдикции >50 тыс. долл.
- Транзитные схемы: зашло → вышло за 1–2 дня
ML-уровень — поведенческие аномалии:
from sklearn.ensemble import IsolationForest
from sklearn.preprocessing import StandardScaler
import pandas as pd
class AMLTransactionMonitor:
def __init__(self):
self.isolation_forest = IsolationForest(
contamination=0.02, # ожидаем ~2% аномалий
n_estimators=200,
random_state=42
)
self.scaler = StandardScaler()
def build_entity_profile(self, entity_id, transactions_90d):
"""Профиль типичного поведения клиента за 90 дней"""
return {
'avg_daily_volume': transactions_90d['amount'].sum() / 90,
'avg_transaction_size': transactions_90d['amount'].mean(),
'top_counterparties': transactions_90d['counterparty'].value_counts().index[:5].tolist(),
'typical_hours': transactions_90d['hour'].value_counts().index[:3].tolist(),
'typical_countries': transactions_90d['country'].value_counts().index[:3].tolist(),
'velocity_std': transactions_90d.resample('D')['amount'].sum().std()
}
def score_transaction(self, transaction, entity_profile, peer_profiles):
"""
Оценка подозрительности транзакции:
1. Отклонение от профиля клиента
2. Отклонение от профиля аналогичных клиентов (peer group)
"""
features = self._extract_features(transaction, entity_profile, peer_profiles)
X = self.scaler.transform(features.reshape(1, -1))
anomaly_score = self.isolation_forest.score_samples(X)[0]
# Конвертация в вероятность (0→нет риска, 1→высокий риск)
risk_score = 1 / (1 + 10 ** (anomaly_score + 0.5))
return float(risk_score)
Graph-based анализ сетей:
GNN (Graph Neural Network) для выявления схем: деньги проходят через 3–5 юрлиц → конечный бенефициар. NetworkX + PyG:
- Узлы: счета, юрлица, физлица
- Рёбра: транзакции с суммами и датами
- GNN обнаруживает типичные «клоны» схем из исторических кейсов
KYC / EDD автоматизация
Автоматическая верификация клиентов:
- OCR + CV: извлечение данных из паспорта, загранпаспорта, ИНН (Tesseract + EasyOCR)
- Face matching: сравнение селфи с фото документа (ArcFace, 99.5%+ accuracy)
- Liveness detection: защита от фото-атак (3D depth map или blink challenge)
- Санкционные списки: проверка по SDN (OFAC), EU Consolidated List, РФ-СПиС
Continuous KYC:
Один раз — недостаточно. Регулятор требует мониторинга изменений профиля:
- NLP-сканирование новостей о клиенте (СПАРК, Руснаш, зарубежные источники)
- Изменение адреса, руководителя, бенефициара → триггер переверификации
- Altman Z-score: финансовая деградация юрлица → повышение risk-категории
Регуляторная отчётность
Автоматизация форм ЦБ:
| Форма | Частота | Автоматизация |
|---|---|---|
| ФинМон 4936-У (ПФР) | Ежедневно | Полная |
| ОБДУЛ (странение выгодоприобретатели) | По событию | 80% |
| 802-П (расчёт достаточности капитала) | Ежемесячно | 70% |
| МСФО-отчётность | Квартально | 60% |
МСФО 9 — Expected Credit Loss:
ML-модель PD (Probability of Default) для расчёта ECL:
- Логистическая регрессия / LightGBM на финансовых показателях заёмщика
- Stageing: Stage 1 / Stage 2 / Stage 3 по изменению кредитного риска
- Forward-looking adjustment: макроэкономические сценарии (базовый/оптимистичный/стрессовый)
Автоматизация проверки операций по 115-ФЗ
Полный цикл обработки подозрительных операций:
- Система флагирует транзакцию (ML score > 0.7 или правило)
- NLP auto-summary: «Операция клиента X: перевод 2.4 млн руб. в пользу ООО Y (зарегистрировано 3 месяца назад), нетипичный контрагент, превышение обычного оборота в 5x»
- Комплаенс-офицер: Accept/Reject/Request info (с AI-черновиком запроса)
- При подтверждении: автоматическое формирование ФЭС/ФСР для Росфинмониторинга
- Сохранение документации для проверок ЦБ
Снижение false positive rate:
Главная проблема наивных правил — 95%+ ложных срабатываний. ML снижает FPR до 60–70% при том же recall за счёт:
- Контекстуализации: та же операция у разных клиентов — разный риск
- Peer group comparison: операция нормальна для этого сегмента бизнеса
- Historical feedback: паттерны закрытых кейсов «не является подозрительным»
Срок разработки: 5–9 месяцев для комплексной RegTech платформы с AML, KYC и автоматической отчётностью.







