Розробка AI-системи аналізу макроекономічних даних для торгівлі
Макроекономічні індикатори — ВВП, інфляція, безробіття, ставки — визначають довгострокові тренди активів. Складність у тому, що ринок торгує очікуванням, а не фактами: не саме значення CPI важливо, а відхилення від консенсус-прогнозу. AI-система аналізує весь спектр макро-даних та формує торгові сигнали.
Джерела макроекономічних даних
Офіційна статистика:
- США: FRED (Federal Reserve Economic Data) — 800,000+ серій, безплатно через API
- Єврозона: Eurostat, ECB Statistical Data Warehouse
- Росія: Центральний банк, API Росстату, data.gov.ru
- Глобальне: IMF Data API, World Bank, OECD.Stat
Економічний календар:
- Investing.com API / Bloomberg Economic Calendar
- Tradingeconomics.com
- ForexFactory (для форекс трейдерів)
Surprise дані:
Economic Surprise = Actual - Consensus Estimate
Citi Economic Surprise Index (CESI) — агрегований індикатор
Bloomberg Economic Surprise Index
Категоризація макро-індикаторів за торговельним впливом
| Категорія | Індикатори | Реакція активу |
|---|---|---|
| Зростання | ВВП, PMI, ISM | Equity +, Bonds -, USD + |
| Інфляція | CPI, PCE, PPI | Bonds -, USD +, Commodities + |
| Зайнятість | NFP, Unemployment | USD ±, Equity ± |
| Монетарна політика | FOMC statement, Dot plot | Short rates, Yield curve |
| Торгівля | Trade Balance, CAD | Currency pair specific |
| Споживач | Retail Sales, UoM Confidence | Equity +, USD ± |
NLP-аналіз монетарної політики
FOMC statements, протоколи засідань ЦБ — тональність тексту впливає на ринки:
Hawkish vs. Dovish Classifier:
from transformers import pipeline
# Fine-tuned FinBERT або RoBERTa на текстах монетарної політики
classifier = pipeline("text-classification", model="central-bank-hawk-dove-v2")
result = classifier(fomc_statement_text)
# {'label': 'HAWKISH', 'score': 0.82}
Central Bank Communication Index: Числовий індекс тональності кожного ЦБ-заяви. Зміна індексу = зміна сигналу про майбутні ставки.
Fed Watcher лінгвістика: конкретні фрази ("patient", "data-dependent", "meeting-by-meeting") мають встановлені ринкові інтерпретації. Словник з 200+ фраз з тональністю.
Nowcasting моделі
Офіційний ВВП публікується з затримкою 30-90 днів. Nowcasting — оцінка поточного ВВП в реальному часі за більш частими індикаторами:
Змінні:
- Щотижневі: jobless claims, retail chains same-store sales
- Щомісячні: retail sales, industrial production, housing starts
- Високочастотні: electricity consumption, freight volumes, OpenTable restaurant bookings
Nowcasting моделі:
- Factor model (DFM — Dynamic Factor Model): стандарт у центробанках
- MIDAS (Mixed Data Sampling): працює зі змінними різної частоти
- Machine learning: XGBoost з feature engineering з mixed-frequency даних
Atlanta Fed GDPNow — публічний приклад nowcasting у production.
Business Cycle Dating
Визначення поточної фази циклу впливає на аллокацію:
| Фаза | Характеристики | Найкращі активи |
|---|---|---|
| Expansion | Зростання ВВП, зниження безробіття | Equities, cyclicals |
| Peak | Перегрів, інфляція, зростання ставок | Commodities, TIPS |
| Contraction | Падіння ВВП, зростання безробіття | Bonds, gold |
| Trough | Мінімуми, початок монетарного стимулу | Equities (early recovery) |
Hidden Markov Model для фаз циклу: 4-стан HMM на monthly macro індикаторах. Emission probabilities відповідають розподілам змінних у кожній фазі.
Система торгових сигналів
Macro Momentum Score:
def compute_macro_score(indicators):
"""
Composite macro momentum: зважена сума нормалізованих
3-місячних змін ключових індикаторів
"""
weights = {
'pmi_manufacturing': 0.20,
'pmi_services': 0.15,
'unemployment_change': -0.15,
'retail_sales_mom': 0.10,
'cpi_surprise': -0.20, # негативна: висока інфляція = bearish
'industrial_production': 0.10,
'yield_curve_slope': 0.10
}
return sum(weights[k] * zscore(indicators[k]) for k in weights)
Торгові правила:
- Macro Score > 1.5σ: overweight equities, underweight bonds
- Macro Score < -1.5σ: underweight equities, overweight bonds + gold
- Yield curve inversion: збільшити recession hedge (long bonds, volatility)
Часовая шкала: базовий data pipeline з FRED + economic calendar — 2-3 тижні. Система з NLP-аналізом ЦБ, nowcasting та торговими сигналами — 3-4 місяці.







