Разработка AI-арбитражного бота на базе ML
Чистый арбитраж (risk-free profit from price difference) почти полностью устранён HFT-алгоритмами. Реальные возможности — статистический арбитраж, который несёт риски и требует ML для нахождения и управления позициями.
Типы арбитражных стратегий
Классический арбитраж (cross-exchange)
Одни и те же активы торгуются на разных площадках с разными ценами. Для крипто: BTC на Binance vs. Bybit. Проблема: latency. Разница цены исчезает за миллисекунды. ML здесь: предсказание вероятности, что разница сохранится достаточно долго для исполнения с учётом transfer time.
Statistical Arbitrage (Pairs Trading)
Коинтегрированные пары активов: долгосрочная равновесная цена существует, краткосрочные отклонения → торговля на возврате к среднему.
ML-расширения классического pairs trading:
- ML-отбор пар: тысячи пар → отбор коинтегрированных через ML кластеризацию корреляционной матрицы
- Kalman Filter: динамический hedge ratio вместо статического OLS
- Nonlinear pairs: нейросеть для нелинейных отношений между активами
import numpy as np
from statsmodels.tsa.stattools import coint
from pykalman import KalmanFilter
# Kalman Filter для динамического hedge ratio
kf = KalmanFilter(
transition_matrices=[1],
observation_matrices=[1],
initial_state_mean=0,
initial_state_covariance=1,
observation_covariance=0.5,
transition_covariance=0.1
)
# hedge_ratios = state means over time
state_means, _ = kf.filter(spreads.values)
Triangular Arbitrage (крипто)
BTC/USDT → ETH/BTC → ETH/USDT → USDT. Цикл из трёх пар на одной бирже. ML предсказывает: часто ли возникает возможность, приоритизирует пути с наибольшим expected profit после fees.
ETF Arbitrage
ETF NAV vs. market price расхождение. Authorized Participants закрывают его через creation/redemption, но на intraday горизонте ML может позиционироваться до их действий.
Funding Rate Arbitrage (крипто)
Spot long + перп short при высоком позитивном funding rate. Нейтральная позиция, доход = funding payments. ML определяет entry/exit по funding rate dynamics.
ML для статарбитражного портфеля
Нахождение возможностей
Correlation matrix на N активах → clustering (K-means на correlation) → нахождение пар внутри кластеров → cointegration testing (Engle-Granger, Johansen).
Масштаб: US equity universe 500+ акций → 125,000 потенциальных пар → фильтрация до 50–200 торгуемых пар.
Управление портфелем пар
Одновременное управление 50+ парами требует:
- Portfolio-level risk control (суммарный Greek exposure)
- Correlation between spreads (некоторые пары коррелированы → риски концентрируются)
- PCA для decomposition sources of spread risk
Signal decay мониторинг
Статарб стратегии умирают со временем: alpha уходит. ML мониторинг: sharpe ratio пары за rolling window → флаг если performance деградирует → исключение пары из торговли.
Execution и latency
Cross-exchange арбитраж
Критичны миллисекунды. Co-location на биржевых серверах. C++/Rust для core execution. Минимизация round-trip latency:
- Предварительно размещённые ордера (resting orders) на обеих биржах
- Simultaneous cancel/place при обнаружении расхождения
Инфраструктурные требования
Dedicated server в datacenter рядом с exchange matching engine (Equinix NY4/LD4 для крипто, CME/NYSE для акций). Network optimization: kernel bypass (DPDK), FPGA для ultra-low latency.
Для статарбитража с дневным горизонтом: latency менее критична, обычный VPS достаточен.







