AI-система для прогнозування пасажиропотоку
Прогнозування пасажиропотоку вирішує операційні завдання громадського транспорту: коли потрібно більше вагонів, де розмістити додатковий персонал та як оптимізувати розклад. Точність ML-систем: MAPE 8-15% для 1-годинного горизонту, що дозволяє приймати операційні рішення протягом 1-2 годин.
Завдання за типом транспорту
Метро:
- Прогноз вхідного/вихідного потоку на кожній станції в 15-хвилинних інтервалах
- Прогноз завантаження вагонів на ділянках
- Оптимізація інтервалів відправлення поїздів
Наземний транспорт (автобус, тролейбус, трамвай):
- Прогноз пасажиропотоку на зупинках
- Прогноз завантаження за маршрутами
- Планування випуску рухомого складу
Залізниця та авіація:
- Прогноз продажу квитків (тісно пов'язаний з прогнозуванням попиту)
- Прогноз пасажиропотоку на вокзалах/аеропортах для укомплектування персоналом
Джерела даних
Дані транзакцій:
- AFC (Automatic Fare Collection): дані турніків — час, станція, тип квитка
- Валідація в автобусах: ID валідатора, маршрут, час
- Продажі квитків через мобільні додатки та касси
Технічні дані:
- CCTV з підрахунком людей (Vision-based people counting)
- Wi-Fi відслідковування: анонімні сеанси пристроїв
- APC (Automatic Passenger Counting): датчики в дверях транспортних засобів
Зовнішні дані:
- Спортивні події, концерти (календар подій)
- Погода
- Міські заходи (паради, демонстрації)
- Перехід між видами транспорту (закриття гілки метро)
Моделі прогнозування
Часові закономірності: Потік на станції має стійкі закономірності:
- Годинні: ранкова пік 07:30-09:30, вечірня 17:30-19:30
- Денні: буденні дні проти вихідних принципово відрізняються
- Сезонні: влітку потік знижується на 15-25%, свята
# LightGBM з багатим набором функцій
features = {
# Лаги
'passengers_lag_15min': passengers_t_minus_1,
'passengers_lag_1h': passengers_t_minus_4,
'passengers_same_time_yesterday': passengers_same_period_yesterday,
'passengers_same_time_last_week': passengers_same_period_week_ago,
# Час
'hour': hour,
'minute': minute,
'day_of_week': dow,
'is_holiday': holiday_flag,
'month': month,
# Зовнішні
'weather_rain': rain_intensity,
'temperature_c': temperature,
'stadium_event_distance_time': event_proximity_score,
# Станція/маршрут
'station_type': encode(terminal_transfer_intermediate),
'line_id': line_embedding
}
Graph Neural Network: Для метро: модель мережі як граф. Потік на станції залежить від потоку на сусідніх станціях — пасажири роблять пересадки, і закриття однієї станції перерозподіляє потік.
Аномальні події та корекції
Виявлення подій: Раптовий стрибок пасажиропотоку перед закриттям станції / після концерту → аномалія.
def detect_flow_anomaly(actual, predicted, threshold_sigma=3.0):
residuals = actual - predicted
z_score = (residuals - residuals.rolling(168).mean()) / residuals.rolling(168).std()
return z_score.abs() > threshold_sigma
Виявлена аномалія → оператор центру управління отримує сповіщення → коригування плану операцій.
Планові події: Заплановані заходи вводяться як відомі майбутні коваріати (TFT). Система автоматично прогнозує +30% пасажиропотоку на годину після завершення концерту в "Лужниках".
Операційні застосування
Регулювання інтервалу: При прогнозованій піці → центр управління отримує рекомендацію: "Через 45 хвилин на станції 'Спортивна' очікується потік +85% до норми. Рекомендується скоротити інтервал з 3 до 1,5 хв."
Укомплектування персоналом на станціях: Прогноз пасажиропотоку → розрахунок потреб в агентах у касах, контролерах → планування змін.
Панель центру управління:
- Тепловізуалізація пасажиропотоку по мережі в реальному часі проти прогнозу
- Прогноз на 1/2/4 години вперед
- Сповіщення при очікуваних аномаліях
- Історія точності прогнозу
Інтеграція:
- АСУПО (Автоматизована система управління операціями пасажирів) — російський стандарт для метро
- ACS (Access Control System): API для отримання даних транзакцій
- ЕЦТО (Єдиний центр транспортного обслуговування)
Метрики:
- MAPE для 15-хвилинного прогнозу: < 10%
- Точність піку: < 15% для піковинх годин (найскладніше)
- Час раннього попередження: операційне попередження за 60-90 хв
Часова шкала: базова модель на AFC-даних для 1 станції/маршруту — 3-4 тижні. Система для всієї мережі з GNN, прогнозуванням з урахуванням подій та інтеграцією центру управління — 4-5 місяців.







