Реалізація прогнозування цін (Price Prediction)
Прогнозування цін застосовується у абсолютно різних контекстах: прогнозування цін на сировину для виробничого планування, прогноз цін на нерухомість для оцінки, прогнозування руху фінансових активів. Кожний домен має свою специфіку, але загальні методологічні принципи єдині.
Типологія задач прогнозування цін
Товарні ринки (commodities): Нафта, газ, метали, сільськогосподарська продукція. Фактори: фʼючерсні криві, запаси, геополітика, погода. Горизонт: 1-12 місяців.
Нерухомість: Оцінка конкретного об'єкту (hedonic pricing model) або прогноз ринкового індексу. Горизонт: 3-24 місяці.
Фінансові активи: Акції, валюти, криптовалюти. Найбільш конкурентне середовище — EMH (Efficient Market Hypothesis) обмежує передбачуваність. Практичний горизонт: 1-30 днів.
Роздрібні ціни: Прогнозування оптимальної ціни для максимізації виручки/маржи з урахуванням цінової еластичності.
Загальна методологія
Розкладання ціни на компоненти:
- Довгостроковий тренд (автокореляція, макро-фактори)
- Сезонність (річна, квартальна, внутрішньотижнева)
- Циклічність (бізнес-цикли)
- Залишок (нерегулярні події, шум)
STL/MSTL-декомпозиція — перший крок аналізу будь-якого цінового ряду.
Hedonic Pricing для нерухомості
Найбільш практична реалізація — оцінна модель:
Фічи:
- Характеристики об'єкту: площа, кімнати, поверх, рік будівництва, матеріал
- Локація: відстань до метро, шкіл, центру; crime index; шкільний район rating
- Інфраструктура: proximity scores до магазинів, парків, лікарень
- Ринкові умови: порівнянні угоди за останні 6-12 місяців
Моделі:
- XGBoost / LightGBM: найкраща точність для табличних даних
- Random Forest: гірша точність, більш стабільна
- Spatial regression (kriging): враховує просторову автокореляцію цін
Точність сучасних hedonic моделей: MAPE 5-12% для житлової нерухомості у містах з хорошими даними.
Прогнозування товарних цін
Модель для нафти (приклад):
Фічи:
- Futures curve slope (contango/backwardation)
- EIA crude oil inventories (щотижневі)
- Baker Hughes rig count
- USD Index (DXY)
- Геополітичний ризик-індекс (NLP із новин)
- Lagged price series: t-1, t-7, t-30, t-365
LightGBM з rolling cross-validation. MAPE 3-8% на тижневому горизонті — прийнятний результат. На 3-місячному горизонті помилка зростає до 15-25%.
Проблема look-ahead bias: всі ознаки повинні бути доступні на момент прогнозу. Фʼючерсна крива на момент t — OK. Дані про запаси за поточний тиждень — ні (публікуються з затримкою).
Цінова еластичність та retail pricing
Не прогнозування майбутньої ринкової ціни, а знаходження оптимальної ціни для максимізації виручки:
Модель еластичності:
log(Demand) = α + β × log(Price) + γ × log(Competitor_Price) + δ × Promotions + ε
β — коефіцієнт цінової еластичності. Типово від -0.5 до -3.0 залежно від категорії.
Dynamic Pricing модель:
- LightGBM прогнозує попит при різних цінових точках
- Оптимізатор (scipy.optimize) знаходить price = argmax(Price × Demand(Price))
- Обмеження: мін/макс ціна, MSRP, цінови имідж бренду
Bayesian optimization дозволяє досліджувати простір цін без шкоди для виручки під час навчання.
Інтеграція та оновлення
- Retail: інтеграція з pricing engine (Revionics, Wiser, custom) через API
- Commodities: експорт прогнозів в ERP/Treasury систему для хеджування
- Нерухомість: REST API для AVM (Automated Valuation Model), інтеграція з CRM агентств
Моніторинг: відстеження MAPE на ковзному вікні 30 днів. При деградації > 30% — автоматичне переквалікування.
Строки: hedonic-модель нерухомості або commodity price forecast — 4-6 тижнів. Retail dynamic pricing з price elasticity та A/B тестуванням — 3-4 місяці.







