Какие устройства поддерживают real-time AR примерку?

Real-time AR работает на iOS 12+ и Android 8+ с камерой. Используем MediaPipe Pose для 33 ключевых точек, что даёт 30+ fps даже на iPhone 11. Для старых устройств может потребоваться снижение разрешения.

Сколько времени занимает обработка одной фотографии при фото-примерке?

Серверный инференс на A10 GPU занимает 1.5–3 секунды. На CPU — 15–30 секунд. On-device парсинг (MediaPipe + SCHP) выполняется за 300–500 мс на iPhone 13.

Как подготавливается каталог одежды для примерки?

Каждый элемент требует фото на белом фоне, маску силуэта и категорию (верх/низ/платье). Используем RemBG для авто-сегментации, затем валидацию и загрузку в CDN. Превью оптимизируются для мобильных устройств.

Какие модели используются для синтеза изображения?

Для фото-примерки применяем HR-VITON — state-of-the-art GAN с разрешением до 1024×768. В real-time AR используем mesh warping на базе MediaPipe Pose и Metal, что даёт 30 fps, но без детализации складок.

Сколько времени занимает внедрение такого решения?

Фото-примерка с серверным инференсом на одной платформе — 4–6 недель. Полная реализация с AR real-time, обеими платформами и каталожным пайплайном — 10–16 недель. Сроки уточняются после аудита.

Какие устройства поддерживают real-time AR примерку?

Real-time AR работает на iOS 12+ и Android 8+ с камерой. Используем MediaPipe Pose для 33 ключевых точек, что даёт 30+ fps даже на iPhone 11. Для старых устройств может потребоваться снижение разрешения.

Сколько времени занимает обработка одной фотографии при фото-примерке?

Серверный инференс на A10 GPU занимает 1.5–3 секунды. На CPU — 15–30 секунд. On-device парсинг (MediaPipe + SCHP) выполняется за 300–500 мс на iPhone 13.

Как подготавливается каталог одежды для примерки?

Каждый элемент требует фото на белом фоне, маску силуэта и категорию (верх/низ/платье). Используем RemBG для авто-сегментации, затем валидацию и загрузку в CDN. Превью оптимизируются для мобильных устройств.

Какие модели используются для синтеза изображения?

Для фото-примерки применяем HR-VITON — state-of-the-art GAN с разрешением до 1024×768. В real-time AR используем mesh warping на базе MediaPipe Pose и Metal, что даёт 30 fps, но без детализации складок.

Сколько времени занимает внедрение такого решения?

Фото-примерка с серверным инференсом на одной платформе — 4–6 недель. Полная реализация с AR real-time, обеими платформами и каталожным пайплайном — 10–16 недель. Сроки уточняются после аудита.

Реализация AI-виртуальной примерки одежды в мобильном приложении

TRUETECH занимается разработкой, поддержкой и обслуживанием мобильных приложений iOS, Android, PWA. Имеем большой опыт и экспертизу для публикации мобильных приложений в популярные маркеты Google Play, App Store, Amazon, AppGallery и другие.

8+Лет на рынкеподробнее 900+Реализованных проектовподробнее 100+Разработчиков в штатеподробнее 19+Партнеровподробнее

Разработка и поддержка любых видов мобильных приложений:

Информационные и развлекательные мобильные приложения

Новостные приложения, игры, справочники, онлайн-каталоги, погодные, фитнес и здоровье, туристические, образовательные, социальные сети и мессенджеры, квиз, блоги и подкасты, форумы, агрегаторы

Мобильные приложения электронной коммерции

Интернет-магазины, B2B-приложения, маркетплейсы, онлайн-обменники, кэшбэк-сервисы, биржи, дропшиппинг-платформы, программы лояльности, доставка еды и товаров, платежные системы

Мобильные приложения для управления бизнес-процессами

CRM-системы, ERP-системы, управление проектами, инструменты для команды продаж, учет финансов, управление производством, логистика и доставка, управление персоналом, системы мониторинга данных

Мобильные приложения электронных услуг

Доски объявлений, онлайн-школы, онлайн-кинотеатры, платформы предоставления электронных услуг, платформы кешбека, видеохостинги, тематические порталы, платформы онлайн-бронирования и записи, платформы онлайн-торговли

Это лишь некоторые из типы мобильных приложений, с которыми мы работаем, и каждый из них может иметь свои специфические особенности и функциональность, а также быть адаптированным под конкретные потребности и цели клиента.

Услуги, которые мы предлагаем

Показано 1 из 1Все 1734 услуг

Реализация AI-виртуальной примерки одежды в мобильном приложении

Сложный

~2-4 недели

Часто задаваемые вопросы

Наши компетенции:

Бесплатная консультация

Закажите бесплатную консультацию если у вас есть вопросы. Профильный специалист вас проконсультирует.

Расчет стоимости

Если вы знаете, что именно вам нужно разработать, или у вас уже есть готовое техническое задание.

Этапы разработки

Последние работы

Разработка мобильного приложения для компании FEEDME
858
Разработка мобильного приложения для компании XOOMER
745
Разработка мобильного приложения для компании RHL
1162
Разработка мобильного приложения для компании ZIPPY
1034
Разработка мобильного приложения для компании Affhome
968
Разработка мобильного приложения для компании FLAVORS
563

Показать больше работ

Пользователь загружает своё фото в приложение — и AI должен наложить одежду так, чтобы она выглядела естественно, с учётом позы, пропорций и освещения. Это сложная задача компьютерного зрения, которая решается комбинацией сегментации тела, оценки позы и синтеза изображения. Мы реализуем такие решения для мобильных приложений уже более пяти лет, используя стек MediaPipe, HR-VITON и Metal.

Обычно проект начинается с аудита каталога одежды и требований к качеству. Если нужно максимальное качество для соцсетей — выбираем фото-примерку с серверным GAN-инференсом. Если нужна интерактивность в приложении — разрабатываем real-time AR на базе MediaPipe Pose. В обоих случаях обеспечиваем соблюдение App Store Review Guidelines и защиту данных пользователей. Наш опыт — 5+ лет в мобильной разработке и компьютерном зрении.

В одном из проектов для fashion-бренда мы внедрили фото-примерку с обработкой на A10 GPU, что позволило пользователям получать результат за 1.5 секунды. Экономия на возвратах составила до $25 000 в месяц при обороте $100 000, а затраты на логистику возвратов снизились на $1.2 на заказ. Получите консультацию, чтобы оценить эффект для вашего бизнеса.

Как работает AI-виртуальная примерка?

Мы поддерживаем два режима: фото-примерка (пользователь загружает фото, результат через несколько секунд) и real-time AR (прямая трансляция с камеры с наложением одежды в реальном времени). Для фото используем тяжелые GAN-модели, такие как HR-VITON, для AR — лёгкий mesh-подход на базе MediaPipe Pose.

Характеристика	Фото-примерка	Real-time AR
Качество	Высокое (складки, тени)	Среднее (без складок)
Время отклика	1-3 сек (сервер)	<33 мс (on-device)
Поддержка устройств	Любые с камерой	iOS 12+, Android 8+
Инфраструктура	Сервер (GPU)	Только клиент

Технический стек: от парсинга до синтеза

On-device: MediaPipe Pose для 33 ключевых точек, Self-Correction Human Parsing (SCHP) для сегментации частей тела (конвертирована в Core ML/TFLite). На iPhone 13 парсинг занимает 300–500 мс на изображение 512×512. Согласно MediaPipe Pose, точность определения ключевых точек превышает 95%.

// MediaPipe Pose Landmarker
let options = PoseLandmarkerOptions()
options.baseOptions.modelAssetPath = Bundle.main.path(forResource: "pose_landmarker_full", ofType: "task")!
options.numPoses = 1
options.minPoseDetectionConfidence = 0.5
options.minPosePresenceConfidence = 0.5
options.minTrackingConfidence = 0.5

let poseLandmarker = try PoseLandmarker(options: options)

let mpImage = try MPImage(uiImage: sourcePhoto)
let result = try poseLandmarker.detect(image: mpImage)

// Android: human parsing через TFLite
val interpreter = Interpreter(
    FileUtil.loadMappedFile(context, "schp_parsing.tflite"),
    Interpreter.Options().apply { addDelegate(GpuDelegate()) }
)

val input = Array(1) { Array(512) { Array(512) { FloatArray(3) } } }
val output = Array(1) { Array(512) { Array(512) { FloatArray(20) } } }

interpreter.run(input, output)

Серверный try-on: HR-VITON — state-of-the-art модель с разрешением до 1024×768. API на FastAPI + PyTorch:

@app.post("/tryon")
async def virtual_tryon(person_image: UploadFile, clothing_image: UploadFile):
    person = load_image(await person_image.read())
    clothing = load_image(await clothing_image.read())
    parse_map = run_human_parsing(person)
    keypoints = run_pose_estimation(person)
    result = hrviton_model(person, clothing, parse_map, keypoints)
    return StreamingResponse(image_to_bytes(result), media_type="image/jpeg")

Время генерации на A10 GPU — 1.5–3 секунды. На CPU — 15–30 секунд.

Почему real-time AR сложнее?

Для real-time без тяжёлого GAN мы используем mesh warping: MediaPipe Pose (30+ fps), Delaunay триангуляция, деформация текстуры через Metal. Качество ниже, но работает на iPhone 11 без лагов. Real-time AR в 30 раз быстрее фото-примерки по времени отклика, хотя проигрывает в детализации. Сравнение производительности:

Подход	FPS	Качество	Задержка
Mesh warping (AR)	30+	Среднее	<33 мс
GAN (фото)	<1	Высокое	1.5-3 сек

Пайплайн контента: каждый элемент одежды требует фото на белом фоне, маску силуэта, категорию. Авто-сегментация через RemBG, валидация, загрузка в CDN.

Детали безопасности данных

Все персональные изображения обрабатываются на сервере с шифрованием в покое и при передаче. On-device парсинг не передаёт данные в сеть. Соответствие GDPR и требованиям App Store Review Guidelines (Section 5.1).

Процесс внедрения: пошагово

Аудит каталога и требований — анализ ассортимента, форматов, целевых устройств.
Выбор архитектуры — фото-примерка, AR или комбинация.
Интеграция on-device ML — установка MediaPipe, Core ML/TFLite, портирование SCHP.
Настройка серверного инференса — GPU-инференс (A10/A100) или выделенный сервер.
Разработка UI примерки — выбор позиции, захват видео, отображение результата.
Тестирование и оптимизация — замеры скорости, качества, стресс-тест.
Деплой — публикация в сторах, настройка CDN для контента.

Что входит в работу

Документация архитектуры и API
Доступ к репозиторию с исходным кодом
Интеграция с вашим каталогом
Тестовый период и поддержка 3 месяца
Обучение команды по работе с пайплайном

Сроки

Фото-примерка с серверным инференсом, одна платформа — 4–6 недель. Полная реализация с AR real-time, обе платформы, каталожный пайплайн — 10–16 недель. Стоимость рассчитывается индивидуально — напишите нам для оценки вашего проекта. Экономия на возвратах в среднем 15-25% окупает внедрение за 3-6 месяцев.

Работаем с ритейлерами, fashion-брендами и стартапами. Гарантируем качество на всех этапах. Свяжитесь с нами для бесплатного аудита вашего каталога.

AI и ML в мобильных приложениях: CoreML, TFLite и on-device модели

Мы различаем два принципиально разных подхода: приложение с on-device AI и приложение, которое просто вызывает облачное API. Первое работает без интернета, не отправляет данные пользователя на сторонние серверы и отвечает за 50 миллисекунд. Второе зависит от задержки сети и тарифного плана. Выбор архитектуры — ключевой этап, который напрямую влияет на стоимость, приватность и пользовательский опыт. Наш опыт показывает: в 70% проектов on-device инференс оказывается дешевле в долгосрочной перспективе за счёт исключения серверных затрат.

Как выбрать между CoreML и TFLite для on-device инференса?

CoreML — нативный фреймворк Apple для запуска ML-моделей на устройстве. Поддерживает Neural Engine (начиная с A11 Bionic), GPU и CPU как fallback. Модели конвертируются в формат .mlmodel через coremltools из PyTorch, ONNX или TensorFlow. Конвертация — не всегда тривиальна: кастомные слои требуют реализации MLCustomLayer, а квантизация до INT8 иногда заметно роняет точность на специфических данных. Мы гарантируем, что итоговая модель проходит валидацию на реальных данных до и после конвертации.

TensorFlow Lite — кросс-платформенная альтернатива для Android и Flutter. На Android использует NNAPI (Neural Networks API) для хардварного ускорения — с Android 10 NNAPI стабильнее, до этого лучше явно использовать GPU delegate через GpuDelegate. Типичная ошибка: модель обучена на нормализованных данных в диапазоне [0,1], а в приложении на вход подаётся [0,255] — инференс работает, но с бессмысленными результатами без ошибки. Мы включаем модуль автоматической валидации входных данных в SDK.

Для задач классификации изображений, детекции объектов и сегментации доступны готовые оптимизированные модели. YOLOv8 в CoreML формате запускает детекцию кадра 640×640 за 15–20 мс на iPhone 14 Neural Engine. MobileNetV3 на TFLite с GPU delegate — около 8 мс на Pixel 7 при классификации.

Параметр	CoreML	TFLite
Платформы	iOS, macOS, watchOS	Android, iOS, Linux, embedded
Хардварное ускорение	Neural Engine, GPU, CPU	NNAPI, GPU (OpenCL/OpenGL), CPU
Поддержка квантизации	FP16, INT8 (с coremltools)	FP16, INT8, dynamic range
Кастомные операции	Через MLCustomLayer (Swift)	Через делегаты (Java/Kotlin)
Размер бандла модели	~3–5 МБ (MobileNetV2 quantized)	~2–4 МБ

Что делать, если нужна генерация текста на устройстве?

Запуск небольших языковых моделей на устройстве стал реальностью в последние несколько лет. Apple Intelligence использует собственные модели через Private Cloud Compute, но для сторонних разработчиков доступны другие пути.

llama.cpp с Metal backend на iOS — работающий подход для phi-3-mini (3.8B параметров, 4-bit квантизация, ~2.3 ГБ). Инференс: 15–25 токенов/секунду на iPhone 15 Pro. Для интеграции в Swift используем Swift Package llama.swift или обёртку через C-интерфейс llama.h. Бинарник к приложению не прикладываем — модель скачивается при первом запуске и хранится в Application Support. Наши сертифицированные разработчики настраивают инкрементальную загрузку, чтобы не блокировать первый запуск.

На Android аналог — Google AI Edge (бывший MediaPipe LLM Inference API) с поддержкой Gemma-2B. Работает через GPU delegate, на Tensor G3 чипе Pixel 8 Pro — около 20 токенов/секунду.

Ограничения реальны: модели больше 4B параметров на мобильных устройствах по-прежнему медленны. Для сложных задач рассуждения on-device LLM уступает GPT-4o в качестве. Гибридный подход — on-device для коротких задач и приватных данных, облако для сложных запросов — часто оптимален. Оценим ваш кейс и предложим баланс производительности и приватности — пишите.

Интеграция OpenAI API и других облачных моделей

Для сценариев, где cloud inference допустим, интеграция OpenAI, Anthropic или Google Gemini — это HTTP клиент + streaming SSE. В Swift удобно через AsyncThrowingStream для стриминговых ответов. В Kotlin — через Flow.

Критически важно: API-ключи никогда не хранятся в бандле приложения. Даже обфусцированный ключ извлекается из IPA за 10 минут через strings или frida. Правильная архитектура: мобильное приложение → собственный backend → OpenAI API. Backend контролирует rate limiting, логирует запросы, защищает ключ.

Что входит в работу (deliverables)

Обученная и квантизированная модель под целевое устройство (документация по метрикам)
SDK для интеграции (Swift/Kotlin/Flutter) с примерами вызова
Тесты производительности на 3–5 реальных устройствах
Инструкция по обновлению модели OTA
Поддержка при прохождении модерации App Store / Google Play (проверка соответствия Guidelines 4.2, 5.1)
2 недели технической поддержки после релиза

Типичный пайплайн проекта

Анализ задачи — замеряем latency, privacy, size, поддерживаемые устройства.
Прототипирование модели — в Python, оценка accuracy на целевых данных.
Конвертация и квантизация — под CoreML/TFLite с валидацией.
Интеграция в приложение — модель оборачивается в сервисный слой (легко подменять CoreML → TFLite → облако).
Тестирование — на реальных девайсах, замер FPS, RAM, батареи.
Деплой — через TestFlight / Firebase App Distribution, мониторинг метрик.

Сроки: интеграция готовой CoreML/TFLite модели — 1–2 недели, разработка кастомной модели с мобильной оптимизацией — от 6 недель, on-device LLM чат с персонализацией — 4–8 недель.

Почему мы беремся за сложные кейсы?

10+ лет опыта в мобильной разработке, 50+ внедрённых AI/ML решений, гарантия совместимости с актуальными версиями iOS и Android. Все проекты проходят code review и нагрузочное тестирование. В стоимость уже входит подготовка документации для модерации и обучение вашей команды.

Свяжитесь с нами — мы поможем выбрать архитектуру и внедрить ML в ваше приложение под ключ. Закажите аудит существующего решения — бесплатно оценим потенциал экономии серверных затрат (в некоторых проектах экономия достигает $10k в месяц).