AI-система для доставочних роботів
Доставочні роботи останної милі працюють у принципово іншому середовищі, ніж складські: неструктуровані міські тротуари, нерівності, пандуси, перехрестя, непередбачувані пішоходи. Це робить завдання значно складніше й вимагає іншого підходу до сприйняття та прийняття рішень.
Перцептивний стек
Доставочний робот (Starship, Kiwibot, Yandex Rover) використовує кількі модальності:
Сенсорний пакет:
- 9-12 камер для 360° огляду (fisheye, 1-2 Мпікселя)
- 2-4 LiDAR (Livox Mid-360 або кастомний solid-state)
- Ультразвукові датчики для ближньої зони (< 1 м)
- RTK GPS для глобальної локалізації + Visual SLAM для точної
Детекція об'єктів:
- YOLOv8 / RT-DETR для пішоходів, велосипедів, автомобілів
- Semantic segmentation (SegFormer) для класифікації поверхонь: асфальт, газон, бордюр, лужа
- Depth estimation з стерео або monocular (UniDepth, DPT)
Все працює на edge-комп'ютері: NVIDIA Jetson Orin NX або аналогу з TensorRT-оптимізацією для 30+ FPS на потік.
Навігація в міському середовищі
Глобальний маршрут: прокладається по HD-карті тротуарів (OSM + власна розмітка). Граф проходимих сегментів з атрибутами: ширина тротуару, тип покриття, наявність бордюру, освітленість вночі.
Локальний планувальник: RL працює тут. Агент навчається в Isaac Sim з фотореалістичними міськими сценами (NVIDIA Omniverse). Завдання: за 10-секундний горизонт обрати траєкторію, уникаючи зіткнень з пішоходами й перешкодами.
Алгоритм: TD3 (Twin Delayed DDPG) для неперервного простору швидкостей. Вхідний тензор: Bird's Eye View (BEV) 64×64 м навколо робота з семантичними шарами + вектор стану.
Робота з неструктурованими перешкодами
Міські тротуари повні edge cases, яких немає в WMS-сценаріях:
| Ситуація | Стратегія |
|---|---|
| Бордюр без пандуса | Об'їзд по HD-карті / пошук пандуса |
| Лужа / сніг | Зниження швидкості, об'їзд |
| Будівельний забір | Перепланування глобального маршруту |
| Натовп пішоходів | Зупинка, чекання проходу |
| Собака без поводка | М'яка зупинка, об'їзд |
Out-of-Distribution (OOD) детектор обробляє рідкі події: якщо впевненість перцептивного модуля нижче порога, система переходить у safe-stop режим та запитує оператора.
Human-in-the-loop телеопрація
Повна автономія досяжна лише при ODD (Operational Design Domain) з чіткими обмеженнями. На старті частина edge cases розв'язується телеоператорами:
- Відеопотік з 4 камер у реальному часі (WebRTC, < 200 мс затримка)
- Оператор бере управління через геймпад
- Усі телеопрації логуються як навчальні дані (DAgger — Dataset Aggregation)
- По мірі накопичення даних відсоток ручного втручання знижується
Типова динаміка: перший місяць — 15-25% місій потребують втручання, через 6 місяців — 1-3%.
Fleet Management і моніторинг
Централізований Fleet Controller:
- Диспетчеризація замовлень: найближчий вільний робот з урахуванням заряду й позиції
- Предиктивна зарядка: розрахунок енергії на маршрут + буфер 20%
- Реальний час: геопозиція + статус кожного робота (Kafka + TimescaleDB)
Метрики операційної ефективності:
- Mission Success Rate: > 95% ціль
- Average Delivery Time vs. ETA: відхилення < 10%
- Intervention Rate: % місій з телеопрацією
- MTBF (Mean Time Between Failures): > 200 ч
Нормативні аспекти
Різні юрисдикції мають різні вимоги. США: NHTSA nadzor, у деяких штатах (Каліфорнія, Техас, Вірджинія) — спеціальні дозволи для sidewalk роботів. Європа: GDPR (обезличення осіб у відеопотоці обов'язково), національні дорожні кодекси.
Privacy-by-design технічна реалізація: детекція осіб + real-time blurring до запису на диск. Зберігання raw відео лише при інцидентах, інакше — лише агреговані дані.
Терміни: MVP з базовою навігацією по тротуару — 4-5 місяців. Production-система з fleet management та телеопрацією — 9-12 місяців.







