AI-базоване вимірювання об'єктів з фотографій у мобільних додатках
Вимірювання ширини шафи без вставання з крісла звучить як маркетингова реклама. За цим стоїть нетривіальна геометрія: калібрування камери, оцінка глибини, детекція еталонного об'єкту. Точність вимірювання без спеціальних умов зйомки становить 5–15%, при правильній методології досягає 2–5%.
Два принципово різні підходи
ARKit/ARCore (LiDAR або SLAM) — точний, але вимагає підтримки пристрою. iPhone 12 Pro та новіші з LiDAR досягають точності 1–3 см на відстанях до 5 метрів. ARCore на Android без LiDAR працює гірше з помилкою 3–8 см.
Монокулярна оцінка глибини — працює на будь-якому пристрої без LiDAR, використовуючи CNN для оцінки глибини з одного кадру. MiDaS, DPT, Depth Anything V2 — актуальні моделі. Точність помітно нижча за LiDAR підходи, але достатня для багатьох застосувань.
// iOS: вибір методу на основі можливостей пристрою
func selectMeasurementMethod() -> MeasurementMethod {
if ARWorldTrackingConfiguration.supportsSceneReconstruction(.mesh) {
return .lidarARKit // iPhone 12 Pro+, iPad Pro
} else if ARWorldTrackingConfiguration.isSupported {
return .slamARKit // ARKit без LiDAR
} else {
return .monocularDepth // fallback на CoreML модель
}
}
Реалізація через ARKit
// Вимірювання відстані між двома точками в AR
class ARMeasurementSession: NSObject, ARSessionDelegate {
var arView: ARSCNView!
private var startAnchor: ARAnchor?
private var endAnchor: ARAnchor?
func placePoint(at screenPoint: CGPoint) -> MeasurementPoint? {
// Raycast з екрану у 3D світовий простір
guard let query = arView.raycastQuery(
from: screenPoint,
allowing: .estimatedPlane,
alignment: .any
) else { return nil }
guard let result = arView.session.raycast(query).first else { return nil }
let worldPosition = result.worldTransform.columns.3 // позиція в метрах
return MeasurementPoint(
position: SIMD3(worldPosition.x, worldPosition.y, worldPosition.z),
confidence: result.targetAlignment == .horizontal ? .high : .medium
)
}
func calculateDistance(from start: MeasurementPoint, to end: MeasurementPoint) -> Measurement<UnitLength> {
let diff = end.position - start.position
let distanceMeters = Double(simd_length(diff))
return Measurement(value: distanceMeters, unit: .meters)
}
}
Поширена помилка полягає в тому, щоб не враховувати, що raycast краще працює на добре текстурованих поверхнях. Біла стіна дає погані результати SLAM відстеження, AR маркери починають «дрейфувати».
Відображення вимірювань в AR
func addMeasurementLine(from start: SIMD3<Float>, to end: SIMD3<Float>,
distance: String) {
let midpoint = (start + end) / 2
// Лінія між точками
let lineNode = SCNNode(geometry: createCylinder(from: start, to: end))
// Етикетка з відстанню в середині
let labelNode = SCNNode(geometry: SCNText(string: distance, extrusionDepth: 0.001))
labelNode.position = SCNVector3(midpoint.x, midpoint.y + 0.02, midpoint.z)
labelNode.scale = SCNVector3(0.005, 0.005, 0.005)
labelNode.constraints = [SCNBillboardConstraint()] // завжди обличчям до камери
sceneRoot.addChildNode(lineNode)
sceneRoot.addChildNode(labelNode)
}
Підхід еталонного об'єкту для вимірювання за фотографіями
Без AR потрібен об'єкт відомого розміру у кадрі. Банківська карта (85.6 × 53.98 мм) служить зручним еталоном:
// Android: вимірювання через еталонний об'єкт
class ReferenceObjectMeasurer {
fun measureWithCard(bitmap: Bitmap, cardBoundingBox: RectF,
objectBoundingBox: RectF): MeasurementResult {
// Реальні розміри карти
val cardRealWidth = 85.6f // мм
val cardRealHeight = 53.98f
// Пікселі → мм
val pixelsPerMmHorizontal = cardBoundingBox.width() / cardRealWidth
val pixelsPerMmVertical = cardBoundingBox.height() / cardRealHeight
// Коригування перспективного спотворення (спрощено)
val correctionFactor = estimatePerspectiveCorrection(
cardBoundingBox, imageDimensions = bitmap.width to bitmap.height
)
return MeasurementResult(
widthMm = (objectBoundingBox.width() / pixelsPerMmHorizontal) * correctionFactor,
heightMm = (objectBoundingBox.height() / pixelsPerMmVertical) * correctionFactor,
accuracy = MeasurementAccuracy.MODERATE // ±5-10% без калібрування
)
}
}
Детекція карти у кадрі здійснюється через ML Kit Object Detection або користувацьку модель YOLOv8 (неважко навчити на 500 зображеннях карт у різних умовах).
Кошторис за часом
Вимірювання ARKit/ARCore з базовим UI (дві точки, відстань) на одній платформі займає 3–5 днів. Повна реалізація — LiDAR + SLAM fallback + монокулярна глибина для старших пристроїв, вимірювання площі та периметру, історія вимірювань, експорт, iOS + Android — вимагає 1–2 тижнів.







