Реалізація AI-редагування відео у мобільному додатку

TRUETECH займається розробкою, підтримкою та обслуговуванням мобільних додатків iOS, Android, PWA. Маємо великий досвід та експертизу для публікації мобільних додатків до популярних маркетів Google Play, App Store, Amazon, AppGallery та інші.

Розробка та підтримка будь-яких видів мобільних додатків:

Інформаційні та розважальні мобільні програми
Новинки, ігри, довідники, онлайн-каталоги, погодні, фітнес та здоров'я, туристичні, освітні, соціальні мережі та месенджери, квіз, блоги та подкасти, форуми, агрегатори
Мобільні програми електронної комерції
Інтернет-магазини, B2B-додатки, маркетплейси, онлайн-обмінники, кешбек-сервіси, біржі, дропшиппінг-платформи, програми лояльності, доставка їжі та товарів, платіжні системи
Мобільні програми для управління бізнес-процесами
CRM-системи, ERP-системи, управління проектами, інструменти для команди продажів, облік фінансів, управління виробництвом, логістика та доставка, управління персоналом, системи моніторингу даних
Мобільні програми електронних послуг
Дошки оголошень, онлайн-школи, онлайн-кінотеатри, платформи надання електронних послуг, платформи кешбеку, відеохостинги, тематичні портали, платформи онлайн-бронювання та запису, платформи онлайн-торгівлі

Це лише деякі з типів мобільних додатків, з якими ми працюємо, і кожен із них може мати свої специфічні особливості та функціональність, а також бути адаптованим під конкретні потреби та цілі клієнта.

Послуги, які ми пропонуємо
Показано 1 з 1Усі 1735 послуг
Реалізація AI-редагування відео у мобільному додатку
Складний
~1-2 тижні
Часті запитання

Наші компетенції:

Етапи розробки

Останні роботи

  • image_mobile-applications_feedme_467_0.webp
    Розробка мобільного додатка для компанії FEEDME
    792
  • image_mobile-applications_xoomer_471_0.webp
    Розробка мобільного додатку для компанії XOOMER
    671
  • image_mobile-applications_rhl_428_0.webp
    Розробка мобільного додатку для компанії RHL
    1097
  • image_mobile-applications_zippy_411_0.webp
    Розробка мобільного додатку для компанії ZIPPY
    969
  • image_mobile-applications_affhome_429_0.webp
    Розробка мобільного додатку для компанії Affhome
    914
  • image_mobile-applications_flavors_409_0.webp
    Розробка мобільного додатку для компанії FLAVORS
    495

Впровадження редагування відео з штучним інтелектом в мобільному додатку

AI-редагування відео — широкий термін, який на практиці розпадається на кілька окремих функцій: автоматичне видалення пауз та слів-паразитів, заміна фону, кольорокорекція за референсом, розумний кроп під формат, автонарізка хайлайтів. Кожна функція вимагає свого технічного рішення.

Автовирізка пауз та слів-паразитів

Це, мабуть, найбільш затребувана функція для контент-мейкерів. Користувач записує розмовне відео, AI видаляє всі паузи довше 0.5 сек та слова «еге», «ну», «як би».

Пайплайн:

  1. Транскрибуємо аудіо через Whisper API (OpenAI) або Deepgram
  2. Отримуємо JSON з timestamps кожного слова
  3. Знаходимо паузи та слова зі стоп-листу
  4. Генеруємо FFmpeg cut-list та збираємо підсумкове відео
# Backend: генерація FFmpeg фільтру з транскрипції Whisper
def build_cut_filter(transcript_words, pause_threshold=0.5, filler_words=None):
    filler_words = filler_words or {"еге", "ну", "ось", "як би", "типа"}
    segments_to_keep = []
    prev_end = 0.0

    for i, word in enumerate(transcript_words):
        gap = word["start"] - prev_end
        if gap > pause_threshold:
            # Пауза — пропускаємо
            pass
        if word["word"].lower().strip(".,!?") in filler_words:
            continue
        segments_to_keep.append((word["start"], word["end"]))
        prev_end = word["end"]

    # Конвертуємо в FFmpeg select/aselect фільтр
    filter_parts = "+".join(
        f"between(t,{s},{e})" for s, e in merge_segments(segments_to_keep, gap=0.05)
    )
    return f"select='{filter_parts}',setpts=N/FRAME_RATE/TB"

Whisper word_timestamps=True дає точність ±20 мс — достатньо для плавних cuts. На мобільному: завантажуємо відео, запускаємо backend-задачу, отримуємо оброблений файл. Все оброблене відео відтворюємо через AVPlayer/ExoPlayer.

Заміна фону у відео

Складніше, ніж звучить. Для статичної камери — portrait segmentation через MediaPipe Selfie Segmentation (30 fps real-time на сучасних пристроях). Для рухомої камери з об'єктами — SAM 2 (Segment Anything Model 2) через API.

MediaPipe на Android:

val options = ImageSegmenterOptions.builder()
    .setBaseOptions(BaseOptions.builder().useGpu().build())
    .setOutputCategoryMask(false)
    .setOutputConfidenceMasks(true)
    .build()
val segmenter = ImageSegmenter.createFromOptions(context, options)

Результат — маска впевненості 0..1. Застосовуємо до кожного кадру через Metal/Vulkan, замінюємо фон на статичне зображення або відеофон. При 1080p 30fps — вимагає GPU рендерингу, CPU не впорається.

Серверна обробка (SAM 2): найкраща якість для складних сцен, але 2–5 хвилин на хвилину відео навіть на A100.

Розумний кроп (Auto Reframe)

Конвертація 16:9 в 9:16 з розумним кропом — завдання object tracking. Adobe Premiere Pro називає це Auto Reframe. На мобільному реалізуємо через:

  • Детекція обличчя за keyframe (кожні 0.5 сек) — VNDetectFaceRectanglesRequest
  • Побудова trajectory руху суб'єкта
  • Плавне панорамування кадру з EasingCurve (не різкі jump cuts)
  • FFmpeg crop фільтр із динамічними параметрами
# FFmpeg: кроп з рухом (x змінюється від 0 до 540 за 10 сек)
ffmpeg -i input.mp4 \
  -vf "crop=608:1080:'min(max(cx-304,0),672)':0" \
  -c:v libx264 output_9x16.mp4

Де cx — x-координата суб'єкта з tracking data. Реалізація: Python-скрипт на backend генерує FFmpeg команду з потрібними параметрами, виконує її, повертає результат.

AI кольорокорекція

За референс-фото — CinematicLUT через Core Image на iOS (100 мс на кадр). За текстовим описом («зроби як ранковий золотистий час») — виклик до backend із LUT-генерацією через Stable Diffusion + ControlNet Color Pipeline.

Терміни

Видалення пауз/слів-паразитів + UI відтворення — 5–7 днів. Мультифункція (reframe, фон, кольорокорекція) з FFmpeg backend інтеграцією — 3–4 тижні. Продуктивне real-time видалення фону — додаткові 2 тижні.