Реализация AI-измерения объектов по фотографии в мобильном приложении
Измерить ширину шкафа, не вставая с кресла — звучит как маркетинговый слоган. За ним — нетривиальная геометрия: camera calibration, depth estimation, reference object detection. Точность результата без специальных условий съёмки — 5–15%, с правильным подходом — 2–5%.
Два принципиально разных подхода
ARKit/ARCore (LiDAR или SLAM) — точный, но требует поддержки устройства. iPhone 12 Pro и новее с LiDAR дают точность 1–3 см на расстоянии до 5 метров. ARCore на Android без LiDAR — хуже, погрешность 3–8 см.
Monocular depth estimation — работает на любом устройстве без LiDAR, использует CNN для оценки глубины по одному кадру. MiDaS, DPT, Depth Anything V2 — актуальные модели. Точность заметно ниже LiDAR-подхода, но для многих задач достаточна.
// iOS: выбор метода в зависимости от возможностей устройства
func selectMeasurementMethod() -> MeasurementMethod {
if ARWorldTrackingConfiguration.supportsSceneReconstruction(.mesh) {
return .lidarARKit // iPhone 12 Pro+, iPad Pro
} else if ARWorldTrackingConfiguration.isSupported {
return .slamARKit // ARKit без LiDAR
} else {
return .monocularDepth // фолбек на CoreML-модель
}
}
Реализация через ARKit
// Измерение расстояния между двумя точками в AR
class ARMeasurementSession: NSObject, ARSessionDelegate {
var arView: ARSCNView!
private var startAnchor: ARAnchor?
private var endAnchor: ARAnchor?
func placePoint(at screenPoint: CGPoint) -> MeasurementPoint? {
// Raycast от экрана в 3D мировое пространство
guard let query = arView.raycastQuery(
from: screenPoint,
allowing: .estimatedPlane,
alignment: .any
) else { return nil }
guard let result = arView.session.raycast(query).first else { return nil }
let worldPosition = result.worldTransform.columns.3 // position в метрах
return MeasurementPoint(
position: SIMD3(worldPosition.x, worldPosition.y, worldPosition.z),
confidence: result.targetAlignment == .horizontal ? .high : .medium
)
}
func calculateDistance(from start: MeasurementPoint, to end: MeasurementPoint) -> Measurement<UnitLength> {
let diff = end.position - start.position
let distanceMeters = Double(simd_length(diff))
return Measurement(value: distanceMeters, unit: .meters)
}
}
Одна из распространённых ошибок — не учитывать, что raycast работает лучше на хорошо текстурированных поверхностях. Белая стена даёт плохой результат SLAM tracking, AR-метки начинают «плыть».
Отображение измерения в AR
func addMeasurementLine(from start: SIMD3<Float>, to end: SIMD3<Float>,
distance: String) {
let midpoint = (start + end) / 2
// Линия между точками
let lineNode = SCNNode(geometry: createCylinder(from: start, to: end))
// Метка с расстоянием в середине
let labelNode = SCNNode(geometry: SCNText(string: distance, extrusionDepth: 0.001))
labelNode.position = SCNVector3(midpoint.x, midpoint.y + 0.02, midpoint.z)
labelNode.scale = SCNVector3(0.005, 0.005, 0.005)
labelNode.constraints = [SCNBillboardConstraint()] // всегда лицом к камере
sceneRoot.addChildNode(lineNode)
sceneRoot.addChildNode(labelNode)
}
Reference object подход для измерения по фото
Без AR — нужен объект известного размера в кадре. Банковская карта (85.6 × 53.98 мм) — удобный reference:
// Android: измерение через reference object
class ReferenceObjectMeasurer {
fun measureWithCard(bitmap: Bitmap, cardBoundingBox: RectF,
objectBoundingBox: RectF): MeasurementResult {
// Реальные размеры карты
val cardRealWidth = 85.6f // мм
val cardRealHeight = 53.98f
// Пиксели → мм
val pixelsPerMmHorizontal = cardBoundingBox.width() / cardRealWidth
val pixelsPerMmVertical = cardBoundingBox.height() / cardRealHeight
// Коррекция на перспективное искажение (упрощённо)
val correctionFactor = estimatePerspectiveCorrection(
cardBoundingBox, imageDimensions = bitmap.width to bitmap.height
)
return MeasurementResult(
widthMm = (objectBoundingBox.width() / pixelsPerMmHorizontal) * correctionFactor,
heightMm = (objectBoundingBox.height() / pixelsPerMmVertical) * correctionFactor,
accuracy = MeasurementAccuracy.MODERATE // ±5-10% без калибровки
)
}
}
Детекция карты в кадре — через ML Kit Object Detection или YOLOv8-кастомный (несложно обучить на 500 снимках карт в разных условиях).
Ориентиры по срокам
ARKit/ARCore измерение с базовым UI (2 точки, расстояние) на одной платформе — 3–5 дней. Полная реализация: LiDAR + SLAM фолбек + monocular depth для старых устройств, измерение площади и периметра, история замеров, экспорт, iOS + Android — 1–2 недели.







