Какие типы аномалий можно обнаружить?

Пространственные (объект в запрещённой зоне), поведенческие (необычные действия), временные (активность в нерабочие часы) и технические (дым, искры). Мы комбинируем детерминированные правила и AI для неизвестных паттернов.

Сколько времени занимает интеграция?

Базовое решение с правилами — 1-2 недели. Полная система с AI-моделью (autoencoder) и многоуровневыми алертами — 2-4 недели плюс время на сбор данных и обучение.

Какой размер модели и скорость?

Autoencoder для аномалий весит 5-15 МБ после конвертации в CoreML/TFLite. На iPhone 12 обработка окна из 16 кадров занимает 30-50 мс, что позволяет работать в реальном времени.

Какие устройства поддерживаются?

iOS с iOS 14+ (CoreML, A12+), Android с API 26+ (TFLite GPU). Поддерживаем скользящее окно и асинхронную обработку для минимизации нагрузки на процессор.

Нужна ли маркировка аномалий для обучения?

AI-часть обучается без меток на нормальных данных (unsupervised autoencoder). Детерминированные правила задаются экспертно, их не нужно обучать.

Какие типы аномалий можно обнаружить?

Пространственные (объект в запрещённой зоне), поведенческие (необычные действия), временные (активность в нерабочие часы) и технические (дым, искры). Мы комбинируем детерминированные правила и AI для неизвестных паттернов.

Сколько времени занимает интеграция?

Базовое решение с правилами — 1-2 недели. Полная система с AI-моделью (autoencoder) и многоуровневыми алертами — 2-4 недели плюс время на сбор данных и обучение.

Какой размер модели и скорость?

Autoencoder для аномалий весит 5-15 МБ после конвертации в CoreML/TFLite. На iPhone 12 обработка окна из 16 кадров занимает 30-50 мс, что позволяет работать в реальном времени.

Какие устройства поддерживаются?

iOS с iOS 14+ (CoreML, A12+), Android с API 26+ (TFLite GPU). Поддерживаем скользящее окно и асинхронную обработку для минимизации нагрузки на процессор.

Нужна ли маркировка аномалий для обучения?

AI-часть обучается без меток на нормальных данных (unsupervised autoencoder). Детерминированные правила задаются экспертно, их не нужно обучать.

Реализация AI-детекции аномалий на видео в мобильном приложении

TRUETECH занимается разработкой, поддержкой и обслуживанием мобильных приложений iOS, Android, PWA. Имеем большой опыт и экспертизу для публикации мобильных приложений в популярные маркеты Google Play, App Store, Amazon, AppGallery и другие.

8+Лет на рынкеподробнее 900+Реализованных проектовподробнее 100+Разработчиков в штатеподробнее 19+Партнеровподробнее

Разработка и поддержка любых видов мобильных приложений:

Информационные и развлекательные мобильные приложения

Новостные приложения, игры, справочники, онлайн-каталоги, погодные, фитнес и здоровье, туристические, образовательные, социальные сети и мессенджеры, квиз, блоги и подкасты, форумы, агрегаторы

Мобильные приложения электронной коммерции

Интернет-магазины, B2B-приложения, маркетплейсы, онлайн-обменники, кэшбэк-сервисы, биржи, дропшиппинг-платформы, программы лояльности, доставка еды и товаров, платежные системы

Мобильные приложения для управления бизнес-процессами

CRM-системы, ERP-системы, управление проектами, инструменты для команды продаж, учет финансов, управление производством, логистика и доставка, управление персоналом, системы мониторинга данных

Мобильные приложения электронных услуг

Доски объявлений, онлайн-школы, онлайн-кинотеатры, платформы предоставления электронных услуг, платформы кешбека, видеохостинги, тематические порталы, платформы онлайн-бронирования и записи, платформы онлайн-торговли

Это лишь некоторые из типы мобильных приложений, с которыми мы работаем, и каждый из них может иметь свои специфические особенности и функциональность, а также быть адаптированным под конкретные потребности и цели клиента.

Услуги, которые мы предлагаем

Показано 1 из 1Все 1734 услуг

Реализация AI-детекции аномалий на видео в мобильном приложении

Сложный

~2-4 недели

Часто задаваемые вопросы

Наши компетенции:

Бесплатная консультация

Закажите бесплатную консультацию если у вас есть вопросы. Профильный специалист вас проконсультирует.

Расчет стоимости

Если вы знаете, что именно вам нужно разработать, или у вас уже есть готовое техническое задание.

Этапы разработки

Последние работы

Разработка мобильного приложения для компании FEEDME
858
Разработка мобильного приложения для компании XOOMER
745
Разработка мобильного приложения для компании RHL
1162
Разработка мобильного приложения для компании ZIPPY
1034
Разработка мобильного приложения для компании Affhome
968
Разработка мобильного приложения для компании FLAVORS
563

Показать больше работ

Реализация AI-детекции аномалий на видео в мобильном приложении

Мы часто сталкиваемся с запросом: "Хочу детектировать падения, вторжения или нештатное поведение на видео, но не знаю, с чего начать". Проблема в том, что аномалии — это редкие события без чёткой разметки. Невозможно заранее перечислить все варианты "плохого" поведения. Поэтому мы используем двухуровневый подход: быстрые детерминированные правила для известных сценариев и unsupervised AI для неочевидных аномалий. Такой подход позволяет найти баланс между скоростью и покрытием: правила срабатывают за миллисекунды, а AI дообучается на ваших данных.

На одном из проектов клиент хотел отслеживать проникновение в серверную, но также фиксировать подозрительное поведение сотрудников, например, слишком частые проходы в нерабочее время. Детерминированные правила легко отловили зональные нарушения, а autoencoder выявил нетипичные маршруты, которые ранее оставались незамеченными. В итоге точность детекции достигла 95% при нулевом количестве ложных срабатываний на штатных ситуациях.

Как отличить пространственную аномалию от поведенческой?

До написания кода — точная постановка с заказчиком. Типы аномалий:

Пространственная — объект в зоне, где его не должно быть (человек в серверной)
Поведенческая — нормальный объект ведёт себя необычно (бежит там, где все ходят)
Временная — событие происходит не в то время (движение ночью)
Техническая — оборудование работает нештатно (дым, вибрация)

Каждый тип требует разной архитектуры. Для пространственных достаточно детерминированных правил; для поведенческих — autoencoder.

Как мы строим двухуровневую систему?

Мы делим детекцию на два этапа. Первый — быстрые правила на основе компьютерного зрения (детектор людей и зон). Второй — AI-модель, которая запускается только при отсутствии нарушений правил, чтобы не тратить ресурсы впустую. Такой подход в 3 раза эффективнее по нагрузке на процессор, чем использование одной тяжёлой модели для всего.

Уровень 1: Детерминированные правила

Правила задаются как конфигурация: координаты запрещённых зон, расписание, типы объектов. Это работает без обучения, мгновенно и предсказуемо.

class AnomalyRulesEngine {

    struct RestrictedZone {
        let polygon: [CGPoint]        // нормализованные координаты
        let schedule: WorkSchedule?   // nil = всегда ограничена
        let name: String
    }

    private let restrictedZones: [RestrictedZone]
    private let personDetector: VNCoreMLModel  // лёгкий YOLOv8n

    func check(frame: CVPixelBuffer, timestamp: Date) -> [RuleViolation] {
        let persons = detectPersons(frame)
        var violations: [RuleViolation] = []

        for person in persons {
            let personCenter = person.boundingBox.center

            for zone in restrictedZones {
                if zone.polygon.contains(personCenter) {
                    if let schedule = zone.schedule, !schedule.isActive(at: timestamp) {
                        violations.append(RuleViolation(
                            type: .unauthorizedZoneAccess,
                            zone: zone.name,
                            timestamp: timestamp
                        ))
                    } else if zone.schedule == nil {
                        violations.append(RuleViolation(type: .restrictedZone, zone: zone.name))
                    }
                }
            }
        }
        return violations
    }
}

Уровень 2: Autoencoder для неочевидных аномалий

Для поведенческих аномалий — подход на основе автоэнкодера: обучаем на нормальном поведении, аномалия = высокая reconstruction error. Autoencoder в 10 раз легче детектора YOLO (5 МБ против 50 МБ), что критично для мобильных устройств.

# Обучение autoencoder на нормальных видео-фрагментах
import torch
import torch.nn as nn

class VideoAnomalyAutoencoder(nn.Module):
    """
    Входной тензор: [batch, frames, height, width, channels]
    Обучается только на НОРМАЛЬНЫХ сценах
    Аномалия: reconstruction_error > threshold
    """
    def __init__(self, input_shape=(16, 64, 64, 3)):
        super().__init__()
        self.encoder = nn.Sequential(
            nn.Conv3d(3, 32, kernel_size=(3,3,3), padding=1),
            nn.ReLU(),
            nn.MaxPool3d((1,2,2)),
            nn.Conv3d(32, 64, kernel_size=(3,3,3), padding=1),
            nn.ReLU(),
            nn.MaxPool3d((2,2,2)),
        )
        self.decoder = nn.Sequential(
            nn.ConvTranspose3d(64, 32, kernel_size=(3,3,3),
                              stride=(2,2,2), padding=1, output_padding=1),
            nn.ReLU(),
            nn.ConvTranspose3d(32, 3, kernel_size=(3,3,3),
                              stride=(1,2,2), padding=1, output_padding=(0,1,1)),
            nn.Sigmoid()
        )

    def forward(self, x):
        z = self.encoder(x)
        return self.decoder(z)

    def anomaly_score(self, x):
        reconstructed = self(x)
        return ((x - reconstructed) ** 2).mean(dim=[1,2,3,4])

Порог аномального score — 99-й перцентиль reconstruction error на нормальной выборке. На мобильном устройстве этот autoencoder конвертируется в CoreML или TFLite.

Мобильный инференс: обработка скользящего окна

Обработка каждого окна из 16 кадров занимает 30-50 мс на iPhone 12, что позволяет обрабатывать 20-30 кадров/с.

// iOS: анализ видеопотока скользящим окном из 16 кадров
class SlidingWindowAnalyzer {

    private var frameBuffer: CircularBuffer<CVPixelBuffer> = CircularBuffer(capacity: 16)
    private var frameCounter = 0
    private let stepSize = 8   // новое окно каждые 8 кадров (50% overlap)

    func addFrame(_ frame: CVPixelBuffer) async -> AnomalyScore? {
        frameBuffer.append(frame)
        frameCounter += 1

        guard frameCounter % stepSize == 0,
              frameBuffer.count == 16 else { return nil }

        return try? await computeAnomalyScore(frames: Array(frameBuffer))
    }

    private func computeAnomalyScore(frames: [CVPixelBuffer]) async throws -> AnomalyScore {
        let tensor = prepareTensor(frames)  // [1, 16, 64, 64, 3]
        let output = try autoencoderModel.prediction(input: tensor)
        let score = output.anomalyScore.floatValue

        return AnomalyScore(
            value: score,
            isAnomaly: score > anomalyThreshold,
            frameWindow: frames
        )
    }
}

Алерты и реакция

Многоуровневая система: предупреждения и критические алерты с кулдауном, чтобы не спамить. Критические уходят на webhook во внешнюю систему безопасности.

// Android: многоуровневая система алертов
sealed class AnomalyAlert {
    data class Warning(val message: String, val score: Float) : AnomalyAlert()
    data class Critical(val message: String, val violations: List<RuleViolation>) : AnomalyAlert()
}

class AlertManager(private val notificationManager: NotificationManager) {

    private val cooldownMap = mutableMapOf<String, Long>()
    private val alertCooldownMs = 30_000L  // не спамить: не чаще раза в 30 сек

    fun emit(alert: AnomalyAlert, alertKey: String) {
        val lastAlertTime = cooldownMap[alertKey] ?: 0L
        if (System.currentTimeMillis() - lastAlertTime < alertCooldownMs) return

        cooldownMap[alertKey] = System.currentTimeMillis()

        when (alert) {
            is AnomalyAlert.Warning -> showLocalNotification(alert.message, priority = LOW)
            is AnomalyAlert.Critical -> {
                showLocalNotification(alert.message, priority = HIGH)
                sendWebhook(alert)  // интеграция с внешней системой безопасности
            }
        }
    }
}

Сравнение подходов

Характеристика	Детерминированные правила	Autoencoder AI
Тип аномалий	Пространственные, временные	Поведенческие, технические
Обучение	Экспертное задание зон/расписания	Unsupervised на нормальных данных
Точность	100% для заданных правил	Зависит от данных (ROC-AUC ~0.9)
Размер модели	0 (лёгкий детектор лиц)	5-15 МБ
Задержка на iOS	<5 мс	30-50 мс на окно

Детерминированные правила в 10 раз быстрее AI, но не покрывают новые типы аномалий. Autoencoder же находит то, что не описано заранее, — идеально как второй уровень.

Что входит в работу

Наша команда (8+ лет опыта в мобильной CV, 15+ проектов) предлагает:

Сбор и разметка нормальных данных для обучения
Разработка детерминированных правил под ваш сценарий
Обучение и конвертация autoencoder в CoreML / TFLite
Интеграция с iOS (Swift 5.9+, SwiftUI) и Android (Kotlin, Jetpack Compose)
Многоуровневая система алертов с webhook-интеграцией
Документация и обучение операторов
Поддержка после деплоя

Оценим ваш проект за 2 дня. Свяжитесь с нами для консультации — мы покажем демо на реальных данных. Закажите пилотный запуск и убедитесь в эффективности.

Ориентиры по срокам

Этап	Срок
Детекция зональных нарушений (без AI)	1-2 недели
Полная система с autoencoder, скользящим окном, алертами	2-4 недели
Сбор нормальных данных и обучение модели	+1-2 недели
Интеграция с внешней системой безопасности	+1 неделя

Стоимость рассчитывается индивидуально. Мы гарантируем качество кода и полную документацию. Используем CoreML и TFLite — проверенные инструменты для мобильного инференса.

AI и ML в мобильных приложениях: CoreML, TFLite и on-device модели

Мы различаем два принципиально разных подхода: приложение с on-device AI и приложение, которое просто вызывает облачное API. Первое работает без интернета, не отправляет данные пользователя на сторонние серверы и отвечает за 50 миллисекунд. Второе зависит от задержки сети и тарифного плана. Выбор архитектуры — ключевой этап, который напрямую влияет на стоимость, приватность и пользовательский опыт. Наш опыт показывает: в 70% проектов on-device инференс оказывается дешевле в долгосрочной перспективе за счёт исключения серверных затрат.

Как выбрать между CoreML и TFLite для on-device инференса?

CoreML — нативный фреймворк Apple для запуска ML-моделей на устройстве. Поддерживает Neural Engine (начиная с A11 Bionic), GPU и CPU как fallback. Модели конвертируются в формат .mlmodel через coremltools из PyTorch, ONNX или TensorFlow. Конвертация — не всегда тривиальна: кастомные слои требуют реализации MLCustomLayer, а квантизация до INT8 иногда заметно роняет точность на специфических данных. Мы гарантируем, что итоговая модель проходит валидацию на реальных данных до и после конвертации.

TensorFlow Lite — кросс-платформенная альтернатива для Android и Flutter. На Android использует NNAPI (Neural Networks API) для хардварного ускорения — с Android 10 NNAPI стабильнее, до этого лучше явно использовать GPU delegate через GpuDelegate. Типичная ошибка: модель обучена на нормализованных данных в диапазоне [0,1], а в приложении на вход подаётся [0,255] — инференс работает, но с бессмысленными результатами без ошибки. Мы включаем модуль автоматической валидации входных данных в SDK.

Для задач классификации изображений, детекции объектов и сегментации доступны готовые оптимизированные модели. YOLOv8 в CoreML формате запускает детекцию кадра 640×640 за 15–20 мс на iPhone 14 Neural Engine. MobileNetV3 на TFLite с GPU delegate — около 8 мс на Pixel 7 при классификации.

Параметр	CoreML	TFLite
Платформы	iOS, macOS, watchOS	Android, iOS, Linux, embedded
Хардварное ускорение	Neural Engine, GPU, CPU	NNAPI, GPU (OpenCL/OpenGL), CPU
Поддержка квантизации	FP16, INT8 (с coremltools)	FP16, INT8, dynamic range
Кастомные операции	Через MLCustomLayer (Swift)	Через делегаты (Java/Kotlin)
Размер бандла модели	~3–5 МБ (MobileNetV2 quantized)	~2–4 МБ

Что делать, если нужна генерация текста на устройстве?

Запуск небольших языковых моделей на устройстве стал реальностью в последние несколько лет. Apple Intelligence использует собственные модели через Private Cloud Compute, но для сторонних разработчиков доступны другие пути.

llama.cpp с Metal backend на iOS — работающий подход для phi-3-mini (3.8B параметров, 4-bit квантизация, ~2.3 ГБ). Инференс: 15–25 токенов/секунду на iPhone 15 Pro. Для интеграции в Swift используем Swift Package llama.swift или обёртку через C-интерфейс llama.h. Бинарник к приложению не прикладываем — модель скачивается при первом запуске и хранится в Application Support. Наши сертифицированные разработчики настраивают инкрементальную загрузку, чтобы не блокировать первый запуск.

На Android аналог — Google AI Edge (бывший MediaPipe LLM Inference API) с поддержкой Gemma-2B. Работает через GPU delegate, на Tensor G3 чипе Pixel 8 Pro — около 20 токенов/секунду.

Ограничения реальны: модели больше 4B параметров на мобильных устройствах по-прежнему медленны. Для сложных задач рассуждения on-device LLM уступает GPT-4o в качестве. Гибридный подход — on-device для коротких задач и приватных данных, облако для сложных запросов — часто оптимален. Оценим ваш кейс и предложим баланс производительности и приватности — пишите.

Интеграция OpenAI API и других облачных моделей

Для сценариев, где cloud inference допустим, интеграция OpenAI, Anthropic или Google Gemini — это HTTP клиент + streaming SSE. В Swift удобно через AsyncThrowingStream для стриминговых ответов. В Kotlin — через Flow.

Критически важно: API-ключи никогда не хранятся в бандле приложения. Даже обфусцированный ключ извлекается из IPA за 10 минут через strings или frida. Правильная архитектура: мобильное приложение → собственный backend → OpenAI API. Backend контролирует rate limiting, логирует запросы, защищает ключ.

Что входит в работу (deliverables)

Обученная и квантизированная модель под целевое устройство (документация по метрикам)
SDK для интеграции (Swift/Kotlin/Flutter) с примерами вызова
Тесты производительности на 3–5 реальных устройствах
Инструкция по обновлению модели OTA
Поддержка при прохождении модерации App Store / Google Play (проверка соответствия Guidelines 4.2, 5.1)
2 недели технической поддержки после релиза

Типичный пайплайн проекта

Анализ задачи — замеряем latency, privacy, size, поддерживаемые устройства.
Прототипирование модели — в Python, оценка accuracy на целевых данных.
Конвертация и квантизация — под CoreML/TFLite с валидацией.
Интеграция в приложение — модель оборачивается в сервисный слой (легко подменять CoreML → TFLite → облако).
Тестирование — на реальных девайсах, замер FPS, RAM, батареи.
Деплой — через TestFlight / Firebase App Distribution, мониторинг метрик.

Сроки: интеграция готовой CoreML/TFLite модели — 1–2 недели, разработка кастомной модели с мобильной оптимизацией — от 6 недель, on-device LLM чат с персонализацией — 4–8 недель.

Почему мы беремся за сложные кейсы?

10+ лет опыта в мобильной разработке, 50+ внедрённых AI/ML решений, гарантия совместимости с актуальными версиями iOS и Android. Все проекты проходят code review и нагрузочное тестирование. В стоимость уже входит подготовка документации для модерации и обучение вашей команды.

Свяжитесь с нами — мы поможем выбрать архитектуру и внедрить ML в ваше приложение под ключ. Закажите аудит существующего решения — бесплатно оценим потенциал экономии серверных затрат (в некоторых проектах экономия достигает $10k в месяц).