Разработка системы feature engineering для крипто-данных
Feature engineering — процесс создания информативных признаков из сырых данных для ML моделей. В крипто-трейдинге это критически важный этап: правильные features могут удвоить качество модели. Система автоматизирует создание, валидацию и отбор features.
Категории признаков:
Price-based: multi-period returns, rolling statistics, price position в диапазоне, distance от moving averages.
Volume: volume ratios, volume-price relationship, OBV, ATR, Money Flow Index.
Technical indicators: RSI, MACD, Bollinger Bands, ADX, Stochastic.
Market microstructure: bid-ask spread, order flow imbalance, funding rate, open interest изменение.
Cross-asset: correlated assets returns, rolling correlation с target.
Feature валидация: проверка на look-ahead bias, missing values, correlation с target, стационарность, variance.
Feature selection: Mutual Information для нелинейной зависимости, SHAP importance из baseline модели, correlation filtering > 0.95, VIF для мультиколлинеарности.
Feature Store архитектура: централизованный Feature Store с версионированием. Raw data → Feature pipelines → Feature Store → Online (Redis) и Offline (Parquet) stores.
Разрабатываем Feature Engineering систему со 100+ автоматически вычисляемыми признаками, валидацией на look-ahead bias, feature selection, Feature Store для централизованного хранения и versioning.







