AI Spatial Computing System (Apple Vision Pro, Quest)

We design and deploy artificial intelligence systems: from prototype to production-ready solutions. Our team combines expertise in machine learning, data engineering and MLOps to make AI work not in the lab, but in real business.

8+Years of workmore info 900+Completed projectsmore info 100+In house employeesmore info 19+Partnersmore info

Offered services

Showing 1 of 1 servicesAll 1566 services

Complex

~2-4 weeks

FAQ

AI Development Areas

Discuss your AI project

Free consultation — we'll show you how AI can solve your challenge

Get a quote

We'll estimate the budget and timeline for your AI project

AI Solution Development Stages

Latest works

B2B ADVANCE company website development
1212
Development of a web application for FEEDME
1161
Website development for BELFINGROUP
852
Development of an online store for the company FURNORO
1041
B2B Advance company logo design
561
Development of a web application for Enviok
822

Show more works

ИИ для Spatial Computing и Apple Vision Pro

Apple Vision Pro — первая массовая платформа, где пользователь взаимодействует с интерфейсом руками и взглядом без физических контроллеров. Это принципиально новые требования к CV-системам: hand tracking, eye tracking, scene understanding и размещение 3D-контента в реальном пространстве — всё работает в реальном времени на устройстве.

Стек ИИ внутри Vision Pro

Apple Vision Pro несёт на борту M2 + R1 чипы. R1 специализирован на обработке сенсорных потоков: 12 камер, 5 сенсоров, LiDAR. Latency от входа камеры до рендера — менее 12ms. Это аппаратная гарантия, которую нельзя воспроизвести программно.

Ключевые CV-возможности платформы через visionOS API:

Hand tracking — 27 суставов на каждую руку, реализовано через ARKit 6 HandAnchor
Eye tracking — gaze direction с точностью ~1°, используется для UIKit interaction без жестов
Scene understanding — PlaneDetection, MeshAnchor (3D-меш окружения в реальном времени), RoomPlan
World anchoring — WorldAnchor для персистентного размещения объектов в пространстве

Разработка кастомных ИИ-моделей для visionOS

Core ML — единственный способ запускать кастомные ML-модели на Vision Pro. Конвертация через coremltools:

import coremltools as ct
import torch

# Конвертация PyTorch модели в Core ML
traced_model = torch.jit.trace(pytorch_model, example_input)
mlmodel = ct.convert(
    traced_model,
    inputs=[ct.TensorType(name="input",
                          shape=ct.Shape(shape=(1, 3, 224, 224)))],
    compute_precision=ct.precision.FLOAT16,  # для Apple Neural Engine
    compute_units=ct.ComputeUnit.ALL  # CPU + GPU + Neural Engine
)
mlmodel.save("CustomModel.mlpackage")

Neural Engine на M2 даёт 15.8 TOPS — достаточно для классификации (EfficientNet-B0: ~2ms), детекции (YOLOv8n: ~8ms), сегментации лёгких моделей.

Практические сценарии применения

Industrial AR — инспекция оборудования. Техник смотрит на агрегат, система распознаёт его (object detection + ID matching), накладывает AR-схему с пошаговым руководством прямо на деталь. Кастомная модель детекции конкретных узлов, обученная на CAD-рендерах (синтетика) + реальные фото.

Retail visualization — покупатель «примеряет» мебель в своей комнате. RoomPlan строит план помещения, PlaneDetection находит пол, SLAM отслеживает положение пользователя, 3D-модель мебели размещается стабильно в мировых координатах.

Medical training — анатомические 3D-структуры наложены на физический манекен. Нужна точная 6DoF-регистрация: QR-маркер или обученная модель pose estimation конкретного манекена.

Spatial analytics — eye tracking + hand tracking дают данные о вниманиии пользователя: что он смотрит, как долго, какие жесты делает. Для UX-исследований и retail — аналитика внимания без камер на голове испытуемого.

Ограничения платформы

Core ML не поддерживает динамические формы в некоторых операциях — модели нужно адаптировать под фиксированный input size
Custom Reality Compositor и низкоуровневый доступ к камерам ограничены — Apple открывает API постепенно
LiDAR точность: ~1-2% от расстояния до 5м, дальше ошибка растёт. Для задач с требованием < 1mm точности (медицина, промышленность) нужны дополнительные маркеры

Сроки разработки

Тип приложения	Сроки
Визуализация 3D-продуктов (retail)	6–10 недель
Industrial AR с кастомным детектором	10–18 недель
Аналитическая платформа с eye tracking	8–14 недель

Стоимость зависит от сложности CV-задачи и интеграций с backend.