Впровадження заміни обличчя з штучним інтелектом в мобільному додатку
Заміна обличчя технічно складніше, ніж просто наложення стилю. Потрібно: детектувати обличчя на вихідному зображенні, детектувати на цільовому, вирівняти landmarks, змішати результат без артефактів по контуру. На мобільному додається обмеження пам'яті та вимога працювати за розумний час.
Чому на пристрої заміна обличчя рідка в 2024
Моделі класу SimSwap, FaceShifter, GHOST працюють з вагами 100–300 MB і вимагають GPU. TFLite-порти існують, але з помітною втратою якості. MediaPipe Face Mesh дає 468 landmarks у реальному часі — хороша база для вирівнювання, але сама заміна все ще вимагає нейромережевого інференсу.
Фактична на пристрої реалізація можлива через Core ML на iPhone 14 Pro+ з дистильованою моделлю: 1–3 секунди на кадр. Android — GPU-делегат TFLite, але поведінка сильно розрізняється між пристроями (Adreno 730 vs PowerVR на бюджетних).
У більшості продакшен-програм заміна обличчя йде через API: InsightFace (open-source self-hosted), Akool, DeepFaceLab API. Akool face_swap ендпоінт приймає source + target зображення та повертає результат за 5–15 секунд.
Пайплайн обробки на клієнті
Перед відправкою на сервер потрібна попередня обробка:
// Android: детекція та кропування обличчя перед відправкою
class FacePreprocessor(private val context: Context) {
private val detector = FaceDetection.getClient(
FaceDetectorOptions.Builder()
.setPerformanceMode(FaceDetectorOptions.PERFORMANCE_MODE_ACCURATE)
.setLandmarkMode(FaceDetectorOptions.LANDMARK_MODE_ALL)
.build()
)
suspend fun extractFace(bitmap: Bitmap): FaceExtractionResult {
val image = InputImage.fromBitmap(bitmap, 0)
val faces = detector.process(image).await()
if (faces.isEmpty()) throw FaceSwapError.NoFaceDetected
if (faces.size > 1) throw FaceSwapError.MultipleFaces
val face = faces.first()
val bounds = face.boundingBox
// Розширюємо границі на 40% для кращого контексту
val expandedBounds = expandRect(bounds, 0.4f, bitmap.width, bitmap.height)
val croppedBitmap = Bitmap.createBitmap(
bitmap, expandedBounds.left, expandedBounds.top,
expandedBounds.width(), expandedBounds.height()
)
return FaceExtractionResult(croppedBitmap, face.headEulerAngleY)
}
}
Кут повороту голови (headEulerAngleY) важливий: при відхиленні >30° якість заміни різко падає — варто попередити користувача.
Змішування та постобробка
Навіть хороша заміна обличчя дає артефакти по краях маски. На клієнті можна застосувати згладжування:
iOS: CIFilter(name: "CIGaussianBlur") на масці обличчя, CIBlendWithMask для плавного переходу. Metal Performance Shaders для складнішої обробки.
Колір шкіри між обличчям та шиєю/фоном може не збігатися — передача кольору через LAB-колірний простір. Фільтри Core Image CIColorCube справляються з цим без OpenCV.
Юридичні обмеження та модерація
Заміна обличчя — область із жорсткими вимогами App Store (Guideline 1.1 Objectionable Content). Apple відхиляє програми, які:
- дозволяють вставити чужі обличчя без явної згоди
- не мають watermark або маркування AI-generated
- можуть використовуватися для deepfake
Обов'язковий мінімум: watermark на результаті, явний дисклеймер в onboarding, Terms of Service з забороною використання реальних людей без згоди, система звітування контенту.
Google Play аналогічно — Policy Center, раздел Sensitive Events.
Модерація контенту на сервері: перед генеруванням пропустити через Amazon Rekognition DetectModerationLabels або Google Cloud Vision Safe Search. Якщо вхідне фото flagged — відклонити на backend, не доводити до генерування.
Зберігання та видалення
Результати заміни обличчя не повинні зберігатися на сервері довше, ніж потрібно для доставки клієнту. Стандартна практика: TTL 24–48 годин, потім автовидалення з S3/GCS. Вхідні фото — видаляти одразу після обробки.
Терміни
Базова інтеграція API з детекцією обличчя та відображенням результату — 4–6 днів. З постобробкою змішування, модерацією контенту, watermarking та відповідністю стор-політикам — 3–4 тижні. Вартість розраховується індивідуально.







