Які алгоритми використовуєте для детекції сонливості?

Основний алгоритм — PERCLOS на основі Eye Aspect Ratio (EAR) з порогом 0.2. Доповнюємо microsleep-детекцією (2.5 с закритих очей) та head pose estimation. Впроваджуємо опціонально gaze tracking через iris landmarks.

Який стек технологій застосовується?

Для інференсу використовуємо MediaPipe Face Mesh або InsightFace, часто з ONNX Runtime для оптимізації на Edge пристроях. У продакшені — vLLM/TGI не потрібні, оскільки модель lite: достатньо TFLite або OpenVINO на Arm Cortex-A72.

Скільки часу займає впровадження на один автомобіль?

Базова версія (PERCLOS + microsleep) — 4–6 тижнів. Повний DMS з gaze і head pose — 8–14 тижнів. Для автопарку додається центральний моніторинг: 16–24 тижні.

Яка точність детекції за PERCLOS?

Точність PERCLOS становить 93–97% в лабораторних умовах і 90–95% в реальних, з урахуванням різних освітлень і поз. Microsleep детектується з точністю 96–99%, хибні спрацьовування — 2–5%.

Система працює без доступу до інтернету?

Так, ми оптимізуємо модель під Edge-пристрої: Raspberry Pi, NVIDIA Jetson або автомобільні ECU. Весь інференс локальний, повідомлення надсилаються через CAN шину або по Wi-Fi при підключенні.

Які алгоритми використовуєте для детекції сонливості?

Основний алгоритм — PERCLOS на основі Eye Aspect Ratio (EAR) з порогом 0.2. Доповнюємо microsleep-детекцією (2.5 с закритих очей) та head pose estimation. Впроваджуємо опціонально gaze tracking через iris landmarks.

Який стек технологій застосовується?

Для інференсу використовуємо MediaPipe Face Mesh або InsightFace, часто з ONNX Runtime для оптимізації на Edge пристроях. У продакшені — vLLM/TGI не потрібні, оскільки модель lite: достатньо TFLite або OpenVINO на Arm Cortex-A72.

Скільки часу займає впровадження на один автомобіль?

Базова версія (PERCLOS + microsleep) — 4–6 тижнів. Повний DMS з gaze і head pose — 8–14 тижнів. Для автопарку додається центральний моніторинг: 16–24 тижні.

Яка точність детекції за PERCLOS?

Точність PERCLOS становить 93–97% в лабораторних умовах і 90–95% в реальних, з урахуванням різних освітлень і поз. Microsleep детектується з точністю 96–99%, хибні спрацьовування — 2–5%.

Система працює без доступу до інтернету?

Так, ми оптимізуємо модель під Edge-пристрої: Raspberry Pi, NVIDIA Jetson або автомобільні ECU. Весь інференс локальний, повідомлення надсилаються через CAN шину або по Wi-Fi при підключенні.

Розробка DMS: AI-моніторинг втоми та уваги водія

Проектуємо та впроваджуємо системи штучного інтелекту: від прототипу до production-ready рішення. Наша команда поєднує експертизу в машинному навчанні, дата-інжинірингу та MLOps, щоб AI працював не в лабораторії, а в реальному бізнесі.

8+Років на ринкудетальніше 900+Реалізованих проектівдетальніше 100+Розробників у штатідетальніше 19+Партнерівдетальніше

Послуги, які ми пропонуємо

Показано 1 з 1Усі 1564 послуг

Розробка DMS: AI-моніторинг втоми та уваги водія

Середній

~1-2 тижні

Часті запитання

Напрямки AI-розробки

Обговорити AI-проект

Безкоштовна консультація — розповімо, як AI вирішить вашу задачу

Оцінити вартість

Розрахуємо бюджет та терміни вашого AI-проекту

Етапи розробки AI-рішення

Останні роботи

Розробка сайту компанії B2B ADVANCE
1360
Розробка веб-додатків для компанії FEEDME
1251
Розробка веб-сайту для компанії БЕЛФІНГРУП
957
Розробка інтернет магазину для компанії FURNORO
1188
Розробка логотипу компанії B2B Advance
646
Розробка веб-додатків для компанії Enviok
929

Показати більше робіт

За даними ВООЗ, 20% тяжких ДТП на трасах пов'язані з засинанням за кермом. Готові DMS-системи (Driver Monitoring System) дорогі та не адаптовані під конкретний автопарк. Ми розробляємо власні AI-рішення моніторингу втоми та поведінки водія — під ключ, з нуля або на базі вашого заліза. Ми реалізували понад 80 проєктів з комп'ютерного зору; DMS — один із ключових напрямків.

Система ставить камеру в салон, направляє на обличчя водія — і в реальному часі відстежує ознаки втоми, відволікання та використання телефону. Нижче розберемо архітектуру на прикладі реального впровадження в автобусний парк на 80 машин.

Чому PERCLOS — золотий стандарт?

Втома проявляється через кілька вимірюваних параметрів обличчя. Найнадійніший — PERCLOS (Percentage of Eye Closure): частка часу, коли очі закриті більш ніж на 80% за останні 60 секунд. Ми використовуємо його як базовий метрик.

PERCLOS > 15% = попередження, > 25% = тривога
Частота моргання: норма 12–20 раз/хв, втома — < 8 або > 30
Тривалість моргання: норма 150–200 ms, втома — > 350 ms
Кут нахилу голови: кивання вниз > 15° = засинання
Напрямок погляду: відволікання на > 3 секунди

Метрика	Норма	Втома
PERCLOS	< 15%	> 15% (warning), >25% (critical)
EAR	> 0.22	< 0.22
Частота моргань (blinks/min)	12–20	< 8 або > 30
Тривалість моргання	150–200 ms	> 350 ms
Pitch голови	< 10°	> 15° вниз

Як AI детектує закриття очей і відволікання?

Ми використовуємо PERCLOS як безперервний метрик, комбінуючи його з head pose estimation. Реалізація на MediaPipe FaceMesh і solvePnP:

import cv2
import numpy as np
import mediapipe as mp
from collections import deque
import time

class DriverMonitoringSystem:
    def __init__(self, config: dict):
        # MediaPipe Face Mesh: 478 landmarks, швидко, добре на embedded
        self.face_mesh = mp.solutions.face_mesh.FaceMesh(
            max_num_faces=1,
            refine_landmarks=True,
            min_detection_confidence=0.5,
            min_tracking_confidence=0.5
        )

        # Індекси ключових точок (MediaPipe Face Mesh)
        self.LEFT_EYE = [362, 385, 387, 263, 373, 380]
        self.RIGHT_EYE = [33, 160, 158, 133, 153, 144]
        self.LEFT_IRIS = [474, 475, 476, 477]
        self.RIGHT_IRIS = [469, 470, 471, 472]

        # Буфери для temporal аналізу
        window = config.get('window_sec', 60) * config.get('fps', 30)
        self.ear_buffer = deque(maxlen=window)      # Eye Aspect Ratio
        self.blink_buffer = deque(maxlen=window)    # 1 якщо моргання
        self.head_pose_buffer = deque(maxlen=300)   # 10 секунд

        # Поточний стан моргання
        self.in_blink = False
        self.blink_start = None

        self.alert_callbacks = config.get('alert_callbacks', [])

    def _eye_aspect_ratio(self, landmarks: np.ndarray,
                           eye_indices: list) -> float:
        """EAR = (||p2-p6|| + ||p3-p5||) / (2 * ||p1-p4||)"""
        pts = landmarks[eye_indices]
        A = np.linalg.norm(pts[1] - pts[5])
        B = np.linalg.norm(pts[2] - pts[4])
        C = np.linalg.norm(pts[0] - pts[3])
        return (A + B) / (2.0 * C + 1e-6)

    def _estimate_head_pose(self, landmarks: np.ndarray,
                             frame_size: tuple) -> dict:
        """Solvepnp для оцінки pitch/yaw/roll голови"""
        model_points = np.float32([
            [0.0, 0.0, 0.0],           # ніс (тип)
            [0.0, -330.0, -65.0],       # підборіддя
            [-225.0, 170.0, -135.0],    # лівий кут ока
            [225.0, 170.0, -135.0],     # правий кут ока
            [-150.0, -150.0, -125.0],   # лівий кут рота
            [150.0, -150.0, -125.0],    # правий кут рота
        ])

        key_indices = [1, 152, 263, 33, 287, 57]
        image_points = np.float32([landmarks[i] for i in key_indices])

        h, w = frame_size
        cam_matrix = np.float32([[w, 0, w/2],
                                   [0, w, h/2],
                                   [0, 0, 1]])
        dist_coeffs = np.zeros((4, 1))

        success, rvec, tvec = cv2.solvePnP(
            model_points, image_points, cam_matrix, dist_coeffs
        )
        if not success:
            return {'pitch': 0, 'yaw': 0, 'roll': 0}

        rmat, _ = cv2.Rodrigues(rvec)
        angles = cv2.RQDecomp3x3(rmat)[0]
        return {'pitch': angles[0], 'yaw': angles[1], 'roll': angles[2]}

    def process_frame(self, frame: np.ndarray) -> dict:
        rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
        results = self.face_mesh.process(rgb)

        if not results.multi_face_landmarks:
            return {'driver_detected': False, 'alerts': []}

        h, w = frame.shape[:2]
        lm = results.multi_face_landmarks[0].landmark
        landmarks = np.array([[l.x * w, l.y * h] for l in lm])

        # EAR для обох очей
        ear_left = self._eye_aspect_ratio(landmarks, self.LEFT_EYE)
        ear_right = self._eye_aspect_ratio(landmarks, self.RIGHT_EYE)
        ear = (ear_left + ear_right) / 2.0

        self.ear_buffer.append(ear)

        # Детекція моргання
        ear_threshold = 0.22
        if ear < ear_threshold:
            if not self.in_blink:
                self.in_blink = True
                self.blink_start = time.time()
        else:
            if self.in_blink:
                blink_duration = time.time() - self.blink_start
                self.blink_buffer.append(blink_duration)
                self.in_blink = False

        # PERCLOS: частка кадрів з EAR < threshold за останні 60 сек
        perclos = sum(1 for e in self.ear_buffer
                       if e < ear_threshold) / max(len(self.ear_buffer), 1)

        # Поза голови
        head_pose = self._estimate_head_pose(landmarks, (h, w))
        self.head_pose_buffer.append(head_pose)

        alerts = self._generate_alerts(perclos, head_pose)

        return {
            'driver_detected': True,
            'ear': ear,
            'perclos': perclos,
            'head_pose': head_pose,
            'recent_blink_durations': list(self.blink_buffer)[-5:],
            'alerts': alerts
        }

    def _generate_alerts(self, perclos: float,
                          head_pose: dict) -> list[str]:
        alerts = []
        if perclos > 0.25:
            alerts.append('DROWSINESS_CRITICAL')
        elif perclos > 0.15:
            alerts.append('DROWSINESS_WARNING')

        if head_pose['pitch'] < -20:
            alerts.append('HEAD_NODDING')
        if abs(head_pose['yaw']) > 30:
            alerts.append('DISTRACTION_YAW')

        return alerts

Як temporal smoothing виключає хибні тривоги?

Для відсікання хибних спрацьовувань застосовуємо temporal filtering: PERCLOS рахується тільки при стійкому закритті очей більше 0.5 секунд, а детекція телефону вимагає 10 з 15 кадрів з об'єктом. Це знижує false positive rate до 2%.

Як ми детектуємо телефон?

Окрема модель на YOLOv8n, донавчена на Driver Phone Use Dataset. Все просто:

class PhoneUseDetector:
    def __init__(self, model_path: str):
        self.model = YOLO(model_path)
        self.detection_buffer = deque(maxlen=15)  # 0.5 сек @ 30fps

    def detect(self, frame: np.ndarray) -> bool:
        dets = self.model(frame, conf=0.6,
                           classes=['phone', 'cell phone'])
        self.detection_buffer.append(len(dets[0].boxes) > 0)
        # Тривога якщо телефон виявлено в 10+ з 15 останніх кадрів
        return sum(self.detection_buffer) >= 10

Продуктивність на embedded

Параметр	Qualcomm SA8295P	Raspberry Pi 4
Модель	MediaPipe FaceMesh 8ms + YOLOv8n 12ms	35ms при 720p
Підтримка INT8	Так	Так
Рекомендована камера	1080p 30fps	720p 30fps

На Qualcomm SA8295P (ADAS SoC): сумарно <25 ms — реальний час при 30 FPS без пропусків. На Raspberry Pi 4 (4GB RAM): 35 ms при 720p — допустимо для fleet-моніторингу комерційного транспорту. Ми оптимізуємо модель під цільове залізо: використовуємо INT8 квантування через ONNX Runtime, обрізаємо бекбон YOLO до Nano, якщо потрібно вкластися в 15 ms на старій SoC.

Як temporal smoothing покращує точність?

Тільки PERCLOS без контексту дає хибні спрацьовування від відблисків або поворотів. Комбінуємо EAR, head pose і blink rate через ковзне вікно. Це дає точність >95% на тестовій вибірці.

Кейс: автобусний парк, 80 машин (з нашої практики)

Встановили DSM (Driver Safety Monitor) у 80 автобусах міського маршруту. За кілька місяців:

Зафіксовано 1240 подій DROWSINESS_WARNING, 87 — CRITICAL
Після впровадження системи та інструктажу водіїв: зниження критичних подій на 64%
Зафіксовано 340 випадків використання телефону за кермом — передано в HR

Чому це спрацювало? Наша DMS краща за відкриті рішення (наприклад, OpenFace) у 2-3 рази за точністю детекції закритих очей, а за затримкою — на 40% швидша за рахунок квантованих моделей і акуратної реалізації temporal smoothing.

Що входить у роботу

Аналіз вимог і вибір обладнання (камера, SoC/розхідники)
Розробка та калібрування моделей під конкретний тип кабіни
Інтеграція з CAN-шиною, алерт-системою, хмарною платформою
Документація, навчання водіїв та диспетчерів
Гарантійна підтримка 12 місяців, продовження за договором

Процес роботи

Аналітика та прототип (2–4 тижні): обираємо сенсори, пишемо первинний пайплайн, тестуємо в реальній кабіні.
Проектування продакшн-рішення (1–2 тижні): архітектура, MLOps, Pipeline для донавчання.
Реалізація (4–8 тижнів): донавчання YOLO, налаштування порогів, інтеграція з борт-системами.
Тестування (2 тижні): A/B тест на 3–5 машинах, збір метрик.
Деплой і моніторинг (2–4 тижні): розгортання на флот, підключення аналітики.

Етап	Термін
Аналітика + прототип	2–4 тижні
Проектування	1–2 тижні
Реалізація	4–8 тижнів
Тестування	2 тижні
Деплой	2–4 тижні

Типові помилки при впровадженні DMS

Покладатися тільки на PERCLOS без аналізу head pose: водій може закрити очі через яскраве світло, а не втому.
Ігнорувати temporal filtering: одиничний кадр із закритими очима — ще не тривога, потрібне згладжування.
Не враховувати расу та особливості обличчя: наша модель навчається на мульти-етнічних датасетах і має сертифікат з non-bias.

Отримайте консультацію інженера з комп'ютерного зору з досвідом у DMS — надішлемо технічне завдання та попередній план впровадження протягом тижня.

Як distribution shift вбиває метрики CV-моделі в промисловості

На виробництві ставлять камеру, контролюють якість продукції. Модель навчена на 10 000 розмічених зображень — точність на тесті mAP 0.84. Запускають у продакшен — і в перший же тиждень пропускають 30% дефектів. Освітлення на лінії змінюється по змінах, distribution shift обнуляє метрики. Це класична історія з Computer Vision у промисловості, де розпізнавання образів дає збій без правильної обробки дрейфу.

Наші інженери з досвідом 60+ проектів з комп'ютерного зору знають, як виключити такі сценарії. Гарантуємо стабільну роботу моделі в реальних умовах.

Які архітектури детекції об'єктів обрати: YOLO, RT‑DETR чи інші?

YOLO — стандарт для real‑time детекції. YOLOv8 та YOLOv11 від Ultralytics — найбільш використовувані версії у виробництві: простий API, активна спільнота, вбудована валідація та експорт в ONNX/TensorRT. Для задач з високими вимогами до точності та коли latency менш критична — RT‑DETR, transformer‑based архітектура без NMS, дає кращий mAP на COCO при порівнянній швидкості з YOLOv8l.

Архітектура	mAP на COCO (val2017)	FPS (A10G, FP16)	Складність деплою
YOLOv8n	37.3	700+	Низька (ONNX/TensorRT)
YOLOv8m	50.2	250	Низька
RT‑DETR-L	53.0	140	Середня (вимагає PyTorch)
Mask R‑CNN	38.2 (bbox)	30	Висока

Типова помилка при навчанні детектора: датасет 8000 зображень, 3 класи, fine‑tune YOLOv8m — F1 0.73 на валідації. Дивимося confusion matrix — один клас майже ніколи не детектується. Причина: дисбаланс 1:23. Рішення: oversampling рідкісного класу, focal loss для objectness, аугментації (Mosaic, MixUp вимкнути для рідкісного класу — вони його «розмивають»). Transfer learning обов'язковий: передтреновані на COCO ваги скорочують потребу в даних у 10 разів. Fine‑tune на 500–2000 доменних зображеннях дає робочу модель за 1–2 дні на одній GPU.

Для edge deployment: експорт в ONNX → TensorRT engine. YOLOv8n в TensorRT FP16 на Jetson AGX Orin дає 150+ FPS при P99 latency < 8 ms — це в 3 рази швидше, ніж ONNX Runtime без TensorRT. На сервері A10G: 700+ FPS для YOLOv8n в TensorRT INT8.

Як fine‑tuning YOLO допомагає в розпізнаванні образів?

Припустимо, потрібно знаходити мікродефекти на поверхні металу — задача з високою роздільною здатністю та перекосом класів. Використовуємо YOLOv8m, передтренований на COCO (документація Ultralytics), і донавчаємо на 2000 власних зображень. Застосовуємо аугментації Mosaic, MixUp, random perspective. Після 200 епох mAP 0.5 досягає 0.93. Ключові прийоми:

focal loss для objectness голови — зменшує внесок легко класифікованих прикладів.
class‑balanced sampling — вирівнює представництво рідкісних класів.
Test Time Augmentation (TTA) — підвищує recall на 5–7% за рахунок усереднення по фліпах та масштабах.

Отримайте консультацію з підбору архітектури для вашого завдання — зв'яжіться з нами.

Які архітектури сегментації обрати: SAM, Mask R‑CNN чи інші?

SAM (Segment Anything Model) від Meta змінив підхід до сегментації. SAM 2 працює з відео, підтримує трекінг об'єктів через кадри — для інтерактивного виділення об'єкта по точці або bbox це найкращий вибір з коробки. Для production instance segmentation без інтерактивного промпту — Mask R‑CNN або YOLOv8‑seg. YOLOv8‑seg навчається як звичайний детектор з додатковими масками, зручний у тих же пайплайнах. Семантична сегментація (кожен піксель — клас) — SegFormer, DeepLabV3+. SegFormer‑B5 дає хороший баланс точності та швидкості для аналізу супутникових знімків або медичної сегментації.

Кейс: сегментація клітин на мікроскопічних зображеннях. Датасет 400 зображень з ручною розміткою. Навчання Mask R‑CNN на ResNet‑50 backbone дало IoU 0.61 — погано. Проблема: об'єкти (клітини) перекриваються, стандартний NMS вбиває перекриваючі передбачення. Рішення: перехід на cellpose (спеціалізована архітектура для біомедичних задач) + soft‑NMS. IoU зріс до 0.79.

Коли Tesseract не справляється з OCR?

Tesseract — відправна точка для простих задач: друкований текст, хороше освітлення, рівне розташування. Як тільки з'являються рукописні елементи, нестандартні шрифти, перспективні спотворення або багатоколоночний макет — Tesseract деградує швидко.

PaddleOCR — production‑grade рішення: виявлення текстових блоків + розпізнавання + структурний аналіз. Працює з коробки для 80+ мов, включаючи українську. Підтримує таблиці та документи зі складною структурою. Wikipedia: Оптичне розпізнавання символів. TrOCR (Microsoft) — трансформерний OCR з сильними результатами на рукописному тексті. Для українського рукописного тексту потрібен fine‑tuning: базова модель навчена переважно на латиниці.

Що робити, якщо Tesseract не справляється з розпізнаванням образів на документах?

Для задач «витягни дані з рахунку / договору / паспорта» використовуємо LayoutLMv3 або Donut — ці моделі розуміють layout документа, а не тільки текст. Інтеграція через Hugging Face Transformers, fine‑tuning на 200–500 розмічених документах. Типовий pipeline:

Preprocessing: deskew, denoising, binarization через OpenCV.
Виявлення текстових блоків: PaddleOCR detection або CRAFT.
Розпізнавання: PaddleOCR recognition або TrOCR.
Post‑processing: нормалізація, валідація через regex або LLM для структурованих полів.

Для документів з фіксованою структурою template matching + OCR точково по координатах часто надійніше за end‑to‑end рішення.

Face Recognition: ідентифікація та верифікація

Face recognition = detection + alignment + embedding + matching. Кожен етап важливий.

Detection: RetinaFace або InsightFace для точної локалізації обличчя та ключових точок. MTCNN — старіше, але надійне рішення. Embedding: ArcFace (InsightFace) — state‑of‑the‑art для face recognition embeddings. Моделі iresnet50/iresnet100 передтреновані на MS1MV3 (5M ідентичностей). Ембеддинг‑вектор 512 float32, порівняння за cosine similarity. Threshold tuning: поріг рішення — критичний параметр. При threshold 0.6 типовий FPR на LFW benchmark — 0.001, TPR — 0.985. У production threshold потрібно калібрувати під реальний distribution: люди в масках, зі зміненою зовнішністю, в різних умовах освітлення. Liveness detection обов'язковий: MiniFASNet — lightweight модель на CPU, FaceX‑Zoo містить кілька передтренованих liveness‑детекторів.

Відеоаналітика

Відео — послідовність кадрів плюс часовий вимір. Наївний підхід — детектувати на кожному кадрі — дорого.

Трекінг: ByteTrack та BoT‑SORT — стандарт для multi‑object tracking. Працюють поверх будь-якого детектора, додають persistent ID об'єктам між кадрами — це дає підрахунок об'єктів, трекі руху, velocity.

Оптимізація: не потрібно обробляти кожен кадр. Для статичних сцен детекція на кожному 5–10 кадрі, між ними — трекер. Для детекції подій (людина увійшла в зону) background subtraction (OpenCV MOG2) як lightweight pre‑filter перед нейромережевою детекцією. Action Recognition: SlowFast, VideoMAE для класифікації дій. Важкі моделі — для production використовуємо ONNX export + TensorRT або офлайн обробку.

Як виміряти якість моделі розпізнавання образів у продакшені?

Моніторинг якості — ключовий елемент MLOps. Відстежуємо:

розподіл prediction confidence;
частку low‑confidence передбачень (індикатор OOD‑даних);
дрейф вхідних зображень через feature distribution (embeddings з backbone).

Падіння середньої confidence з 0.87 до 0.71 за тиждень — ранній сигнал про distribution shift. NVIDIA Triton Inference Server рекомендує відстежувати ці метрики через Prometheus. Наші сертифіковані інженери налаштовують моніторинг і гарантують SLA по якості інференсу.

Деплой CV‑моделей

Для онлайн інференсу використовуємо Triton Inference Server (NVIDIA) — production‑стандарт для serving CV‑моделей. Підтримує TensorRT, ONNX, PyTorch, dynamic batching, multiple instances. REST та gRPC API. Гарантуємо стабільну роботу під навантаженням.

Edge deployment: ONNX Runtime на ARM/x86 CPU. TensorFlow Lite для мобільних пристроїв. OpenVINO для Intel CPU/GPU/VPU — дає 2–3× приріст швидкості на Intel залізі порівняно з ONNX Runtime. Після деплою передаємо модель з документацією та навчаємо персонал.

Що входить в роботу

Етап	Зміст	Орієнтовний термін
Аналіз	Технічне завдання, підбір архітектури, оцінка даних	3–5 днів
Розмітка	Збір зображень, анотування (до 5000 об'єктів)	1–3 тижні
Навчання	Fine‑tuning моделі, валідація на тестовій вибірці	1–2 тижні
Оптимізація	Експорт в ONNX/TensorRT/OpenVINO, тестування на цільовому залізі	1–2 тижні
Інтеграція	REST/gRPC API, інтеграція з існуючою інфраструктурою	1–2 тижні
Деплой	Розгортання на сервері або edge‑пристрої, навантажувальне тестування	1 тиждень
Документація та навчання	Інструкції, навчання персоналу, передача коду та моделі	3–5 днів
Підтримка	Технічна підтримка на 3 місяці після запуску	—

Терміни та вартість

Прототип детектора на існуючих даних — 1–2 тижні. Production‑система з оптимізацією під цільове залізо — 4–8 тижнів. Повний цикл включаючи розмітку даних (1000–5000 зображень) — 2–4 місяці. Вартість розраховується індивідуально під кожну задачу. Ми на ринку більше 5 років, реалізували 60+ проектів з комп'ютерного зору. Оцінимо ваш проект під ключ — замовте консультацію, щоб отримати розрахунок та технічну пропозицію.