Разработка AI-трейдинг-бота для фондового рынка
Фондовый рынок — высококонкурентная среда. Большинство edge со временем арбитрируется. Устойчивое преимущество — в уникальных данных, скорости или ML-моделях, которые конкуренты не воспроизвели.
Источники alpha на фондовом рынке
Price/Volume Features
Классические технические индикаторы (RSI, MACD, Bollinger Bands) — публично известны, большинство edge давно арбитрировано. ML ищет нелинейные комбинации и адаптивные паттерны.
Useful signals: order book imbalance, trade size distribution, intraday seasonality patterns, volume-weighted features.
Fundamental Features
Финансовые метрики из отчётности: P/E, P/B, EV/EBITDA, ROE trend, earnings surprise history. Fama-French + ML: 6-factor модель + ML-отбор вторичных признаков.
Alternative Data
Здесь современный edge:
- Credit/debit card transaction data (Yodlee, Plaid aggregates): предсказание выручки ритейла до отчёта
- Job postings: рост headcount → рост выручки, изменения в tech stack → стратегические изменения
- Satellite imagery: parking lot cars, cargo ship tracking
- App download data (Sensor Tower): активность мобильных компаний
- ESG данные: текстовый анализ sustainability отчётов
NLP сигналы
Earnings call transcripts: sentiment + specificity языка менеджмента коррелирует с future returns (Shiller, Tetlock исследования). Fine-tuned FinBERT для анализа финансовых текстов. News flow sentiment — краткосрочный сигнал (1–5 дней horizon).
Архитектура Multi-Factor Model
import lightgbm as lgb
from sklearn.pipeline import Pipeline
# Multi-factor ensemble
features = [
# Price momentum
'mom_1m', 'mom_3m', 'mom_6m', 'mom_12m',
# Value
'pb_ratio', 'pe_ratio', 'ev_ebitda', 'fcf_yield',
# Quality
'roe', 'roa', 'gross_margin_trend', 'accruals',
# Sentiment
'earnings_sentiment_score', 'news_sentiment_30d',
# Alternative
'cc_transaction_growth', 'job_posting_trend',
# Technical
'rsi_14', 'vol_20d_normalized', 'ob_imbalance'
]
model = lgb.LGBMRegressor(
n_estimators=500,
learning_rate=0.01,
num_leaves=31,
objective='rank_xendcg', # Learning to rank for cross-sectional alpha
subsample=0.8,
colsample_bytree=0.6,
)
Cross-sectional alpha: предсказание не абсолютного возврата, а ranking акций относительно друг друга. Портфель: long top quintile, short bottom quintile. Market-neutral = без market risk exposure.
Execution для акций
Ликвидность
US large-cap: неограниченная ликвидность для большинства размеров. US small-cap, российский ММВБ: market impact значителен. Position sizing с учётом Average Daily Volume: максимум 1–5% ADV за день.
Регуляторные ограничения
Short selling: не все акции доступны в short, hard-to-borrow rate может достигать 20%+ для high short interest. SEC Rule 105 (Regulation M): ограничения на pre-IPO short. Pattern Day Trader rule (США): <$25k капитал → максимум 3 day trades за 5 дней.
Комиссии и налоги
Interactive Brokers: $0.0035/акцию или $0.35 minimum. Российские брокеры: 0.035–0.1% от оборота. Налог на прибыль в России: 13% НДФЛ для резидентов. Все должны быть в backtest.
Мониторинг и дисциплина
Одна из главных проблем — overriding системы в убыточные периоды. Backtest показывает: каждая известная стратегия имела многомесячные drawdown periods. Discipline необходима.
Monitoring dashboard:
- Real-time P&L vs. benchmark
- Strategy-level attribution
- Factor exposure drift
- Turnover и транзакционные издержки
- Risk metrics: volatility, Sharpe, max drawdown
Automated circuit breakers: остановка стратегии при drawdown > N% или sharpe < threshold за rolling period.







