Обучення ML-моделі предсказання ціни крипто
Прогнозування цін крипто за допомогою машинного навчання — одна з найскладніших задач у quant finance. Ринок адаптивен: паттерн, що працював вчора, завтра може бути арбітражирован до нуля. Проте, грамотно побудовані моделі дають статистичне преимущество на горизонті кількох годин.
Регресія vs класифікація: прогнозувати точну ціну (регресія) значно складніше, ніж прогнозувати напрямок (класифікація). Для торгівлі зазвичай використовується класифікація: «ціна виросте на >0.5% протягом наступних 4h?»
Target engineering: правильний таргет критичний:
- Forward return: (price[t+n] - price[t]) / price[t]
- Бінарний напрямок: sign(forward_return)
- Tercile класифікація: buy (top 33%), hold, sell (bottom 33%)
Feature Engineering:
Price-based ознаки: returns за різні періоди, технічні індикатори (RSI, MACD, Bollinger Bands), volume ознаки, вимірювання волатильності.
On-chain ознаки (для BTC/ETH): exchange inflow/outflow, активні адреси, hash rate, NVT ratio, SOPR, NUPL.
Market microstructure: bid-ask spread, order book imbalance, funding rate, зміни open interest.
Критичні аспекти:
- Look-ahead bias: ознаки мають рахуватися тільки з інформації, доступної на момент t
- Walk-forward валідація: обов'язкова для часових рядів
- Purging та embargoing: очищення train set від перекриваючихся labels
Вибір ознак: SHAP значення для інтерпретування, correlation filtering, VIF для мультиколлінеарності.
Розробляємо повний pipeline: feature engineering, обучення кількох моделей, walk-forward валідація, SHAP інтерпретація, production API для realtime предсказань та MLflow tracking.







