Что такое co-streaming в мобильном приложении?

Co-streaming — это режим, в котором два или более стримеров транслируют одновременно, при этом зрители видят объединённое видео. Технически это комбинация WebRTC для связи между стримерами и RTMP для трансляции на платформу.

Какие архитектуры co-streaming существуют?

Два основных варианта: client-side mixing — смешивание потоков на устройстве стримера (дешевле, но требует мощного CPU/GPU и нестабильно при плохой сети) и server-side mixing — использование MCU/SFU на сервере (стабильнее, масштабируется, но дороже). Для продакшена с 1000+ одновременных стримов рекомендуем серверный подход.

Как решается проблема задержки аудио при совместном стриме?

При client-side mixing задержка WebRTC-аудио (150–200 мс) вызывает рассинхрон с локальным аудио. Решение — компенсация: локальное аудио задерживается на то же время через AVAudioPlayerNode.scheduleBuffer с явным AVAudioTime.

Какие инструменты используются для WebRTC на iOS и Android?

На iOS используется GoogleWebRTC (CocoaPods) или WebRTC.xcframework от Google. На Android — org.webrtc:google-webrtc или stream-webrtc-android. В обоих случаях основной объект — RTCPeerConnection/PeerConnection.

Сколько времени занимает разработка co-streaming?

Client-side co-стрим (iOS, два участника, Metal-композиция, базовый сигнальный сервер) — 5–7 недель. Полная реализация с MCU, поддержкой Android, AEC и управлением состоянием — 8–12 недель. Сроки уточняются после анализа требований.

Что такое co-streaming в мобильном приложении?

Co-streaming — это режим, в котором два или более стримеров транслируют одновременно, при этом зрители видят объединённое видео. Технически это комбинация WebRTC для связи между стримерами и RTMP для трансляции на платформу.

Какие архитектуры co-streaming существуют?

Два основных варианта: client-side mixing — смешивание потоков на устройстве стримера (дешевле, но требует мощного CPU/GPU и нестабильно при плохой сети) и server-side mixing — использование MCU/SFU на сервере (стабильнее, масштабируется, но дороже). Для продакшена с 1000+ одновременных стримов рекомендуем серверный подход.

Как решается проблема задержки аудио при совместном стриме?

При client-side mixing задержка WebRTC-аудио (150–200 мс) вызывает рассинхрон с локальным аудио. Решение — компенсация: локальное аудио задерживается на то же время через AVAudioPlayerNode.scheduleBuffer с явным AVAudioTime.

Какие инструменты используются для WebRTC на iOS и Android?

На iOS используется GoogleWebRTC (CocoaPods) или WebRTC.xcframework от Google. На Android — org.webrtc:google-webrtc или stream-webrtc-android. В обоих случаях основной объект — RTCPeerConnection/PeerConnection.

Сколько времени занимает разработка co-streaming?

Client-side co-стрим (iOS, два участника, Metal-композиция, базовый сигнальный сервер) — 5–7 недель. Полная реализация с MCU, поддержкой Android, AEC и управлением состоянием — 8–12 недель. Сроки уточняются после анализа требований.

Co-streaming в мобильном приложении: WebRTC + RTMP

TRUETECH занимается разработкой, поддержкой и обслуживанием мобильных приложений iOS, Android, PWA. Имеем большой опыт и экспертизу для публикации мобильных приложений в популярные маркеты Google Play, App Store, Amazon, AppGallery и другие.

8+Лет на рынкеподробнее 900+Реализованных проектовподробнее 100+Разработчиков в штатеподробнее 19+Партнеровподробнее

Разработка и поддержка любых видов мобильных приложений:

Информационные и развлекательные мобильные приложения

Новостные приложения, игры, справочники, онлайн-каталоги, погодные, фитнес и здоровье, туристические, образовательные, социальные сети и мессенджеры, квиз, блоги и подкасты, форумы, агрегаторы

Мобильные приложения электронной коммерции

Интернет-магазины, B2B-приложения, маркетплейсы, онлайн-обменники, кэшбэк-сервисы, биржи, дропшиппинг-платформы, программы лояльности, доставка еды и товаров, платежные системы

Мобильные приложения для управления бизнес-процессами

CRM-системы, ERP-системы, управление проектами, инструменты для команды продаж, учет финансов, управление производством, логистика и доставка, управление персоналом, системы мониторинга данных

Мобильные приложения электронных услуг

Доски объявлений, онлайн-школы, онлайн-кинотеатры, платформы предоставления электронных услуг, платформы кешбека, видеохостинги, тематические порталы, платформы онлайн-бронирования и записи, платформы онлайн-торговли

Это лишь некоторые из типы мобильных приложений, с которыми мы работаем, и каждый из них может иметь свои специфические особенности и функциональность, а также быть адаптированным под конкретные потребности и цели клиента.

Услуги, которые мы предлагаем

Показано 1 из 1Все 1734 услуг

Co-streaming в мобильном приложении: WebRTC + RTMP

Сложный

от 2 недель до 3 месяцев

Часто задаваемые вопросы

Наши компетенции:

Бесплатная консультация

Закажите бесплатную консультацию если у вас есть вопросы. Профильный специалист вас проконсультирует.

Расчет стоимости

Если вы знаете, что именно вам нужно разработать, или у вас уже есть готовое техническое задание.

Этапы разработки

Последние работы

Разработка мобильного приложения для компании FEEDME
858
Разработка мобильного приложения для компании XOOMER
744
Разработка мобильного приложения для компании RHL
1161
Разработка мобильного приложения для компании ZIPPY
1034
Разработка мобильного приложения для компании Affhome
968
Разработка мобильного приложения для компании FLAVORS
563

Показать больше работ

Как объединить WebRTC и RTMP на мобильном устройстве?

Мы часто сталкиваемся с задачей в мобильном приложении: два стримера должны транслировать одновременно, зрители видят обоих, а задержка минимальна. Технически это пересечение WebRTC (Wikipedia) и RTMP (трансляция результата зрителям). На мобильных устройствах с ограниченными ресурсами объединить их нетривиально — особенно когда требуется синхронизация аудио и видео в реальном времени. В среднем на реализацию MVP уходит 5–7 недель, но полное решение с поддержкой обоих платформ и AEC занимает до 12 недель. Типичная задержка при client-side mixing — 150–300 мс, мы научились снижать её до 50–100 мс за счёт оптимизации аудиопайплайна. При этом server-side подход (MCU/SFU) даёт задержку 100–150 мс, но требует аренды серверов примерно за 200–500 у.е. в месяц на каждые 1000 одновременных стримов — что окупается при высокой нагрузке. Наш опыт показывает, что для приложений с 500–2000 DAU client-side mixing экономит до 60% бюджета на инфраструктуре.

Архитектура co-стрима

Стандартная схема:

Стример A: камера → WebRTC → Сигнальный сервер ← WebRTC ← камера: Стример B
                                     ↓
                            Mixing Server (SFU/MCU)
                                     ↓
                          RTMP → Twitch/YouTube/Custom

Но на мобиле добавляется вариант без MCU — client-side mixing. Стример A получает видео стримера B через WebRTC, смешивает оба потока локально через Metal/OpenGL и отправляет смешанный стрим на RTMP. Это дешевле серверно, но требует мощного процессора на устройстве и нестабильно при плохой сети второго участника.

В продакшене для приложений с 1000+ одновременных co-стримов — только серверный MCU/SFU (LiveKit, mediasoup, Agora). Для MVP с небольшой нагрузкой — client-side mixing работает.

Сравнение подходов:

Критерий	Client-side mixing	Server-side MCU/SFU
Стоимость инфраструктуры	Низкая (только сигнальный сервер)	Высокая (сервер микширования)
Задержка	Низкая (локальное смешивание)	Средняя (зависит от региона)
Требования к устройству	Высокие (CPU/GPU)	Низкие (только WebRTC)
Масштабируемость	До 2 участников	10+ участников
Сложность реализации	Средняя	Высокая

Дополнительно сравним методы микширования:

Метод	Задержка аудио	Сложность реализации
Client-side (Metal)	150–200 ms	Средняя
Server-side (MCU)	100–150 ms	Высокая
Server-side (SFU)	50–100 ms	Высокая

WebRTC на iOS и Android

iOS: GoogleWebRTC (CocoaPods) или WebRTC.xcframework от Google. Основной объект — RTCPeerConnection. Инициализация:

let config = RTCConfiguration()
config.iceServers = [RTCIceServer(urlStrings: ["stun:stun.l.google.com:19302"],
                                  username: nil, credential: nil)]
config.sdpSemantics = .unifiedPlan

let constraints = RTCMediaConstraints(
    mandatoryConstraints: ["OfferToReceiveVideo": "true",
                           "OfferToReceiveAudio": "true"],
    optionalConstraints: nil
)
let peerConnection = factory.peerConnection(with: config,
                                            constraints: constraints,
                                            delegate: self)

Android: org.webrtc:google-webrtc:1.0.+ или io.getstream:stream-webrtc-android. Логика аналогичная через PeerConnection.

Сигнальный сервер — WebSocket, который обменивает SDP offer/answer и ICE candidates между стримерами. Обычно пишем на Node.js (ws) или используем готовый — LiveKit Server, Agora RTM.

Почему client-side mixing — не панацея?

Главные проблемы, с которыми мы сталкиваемся в реальных проектах:

Задержка аудио при смешивании

Отметим: когда A слышит B через WebRTC с задержкой 150–200 ms, а стрим формируется из локального аудио A, зрители слышат рассинхрон. Решение: компенсация задержки через AVAudioPlayerNode.scheduleBuffer с явным AVAudioTime, чтобы локальное аудио A в итоговом стриме было задержано на то же время, что и входящее от B.

Echo cancellation

Если у стримера нет наушников, его микрофон захватывает звук из динамика (WebRTC-аудио от партнёра). Встроенный AEC WebRTC работает только на аудиотреке RTCPeerConnection. При кастомном аудиопайплайне нужен AVAudioEngine с AVAudioUnitEQ + собственный AEC или speex DSP.

Переключение между co-стримом и solo

При выходе партнёра из co-стрима нужно плавно убрать его окно из композиции и перестроить layout без прерывания RTMP-трансляции. Это означает: Metal render pass должен проверять наличие второй текстуры и корректно рендерить full-frame режим, если второй участник отключился.

Как мы это делаем: опыт реализации под ключ

Наши инженеры с многолетним опытом в мобильной разработке предлагают решение co-streaming под ключ. Мы прорабатываем архитектуру, выбираем оптимальный стек (client-side или server-side), реализуем WebRTC-интеграцию, композицию видео и аудио, а также сигнальный сервер. Пример одного из проектов: для social-платформы с 10 000 DAU мы реализовали двухпользовательский co-стрим на iOS с client-side mixing и компенсацией задержки аудио — проект занял 6 недель. Стоимость такого решения варьируется от 1.5 до 3.5 тыс. у.е. в зависимости от сложности, что значительно дешевле аренды серверного MCU (около 500 у.е. в месяц). Оценим ваш проект — свяжитесь с нами для консультации. Получите консультацию по вашему проекту — мы оценим требования и предложим оптимальное решение.

Подробнее о типовых сроках и стоимости

Для MVP с client-side mixing на одной платформе (iOS) — 5–7 недель. Полный проект с двумя платформами и серверной архитектурой — 8–12 недель. Точная стоимость рассчитывается после аудита требований.

Процесс работы

Аналитика: обсуждаем требования, нагрузку, целевую аудиторию. Определяем, нужен client-side или server-side подход.
Проектирование: разрабатываем схему сигнального сервера, протоколы, API для состояния стрима.
Реализация: пишем код на Swift/Kotlin, интегрируем WebRTC, настраиваем аудиопайплайн.
Тестирование: проверяем задержку, качество при различных сетевых условиях, эхо. Проводим нагрузочное тестирование с 1000 виртуальных пользователей.
Деплой: настраиваем серверную часть, CI/CD, публикуем в App Store или Google Play.

Что входит в работу

Документация по архитектуре и API.
Исходный код мобильного приложения и сигнального сервера.
Настройка CI/CD (TestFlight, Firebase App Distribution).
Интеграция с выбранной streaming-платформой.
Поддержка в течение 30 дней после сдачи.

Сроки

Client-side co-стрим (iOS, два участника, Metal-композиция, базовый сигнальный сервер): 5–7 недель. Полная реализация с MCU, Android-поддержкой, AEC, управлением состоянием: 8–12 недель. Стоимость рассчитывается индивидуально после анализа требований и выбора архитектуры.

Оценим ваш проект — свяжитесь с нами для консультации. Получите консультацию по вашему проекту — мы оценим требования и предложим оптимальное решение.

Как выбрать подход к камере на мобильных платформах

Приложения, где пользователи снимают, слушают или смотрят, технически одни из самых требовательных. Мы сталкиваемся с этим каждый день. Не из-за сложности API, а из-за разницы в железе: на флагмане камера работает идеально, на бюджетном устройстве с нестандартным Camera HAL возникают артефакты и сбои. На iOS стабилизация одного поколения отличается от другого. Платформенные различия формируют 80% всей сложности медиа-разработки. Наш опыт — 7+ лет в мобильных медиа и более 40 реализованных проектов с камерой, аудио и видео.

CameraX против Camera2 и AVFoundation

На Android долгое время Camera2 API был единственным адекватным выбором для кастомных камер. Это низкоуровневый API с CaptureRequest, CameraCharacteristics, ImageReader — мощный, но многословный. Только preview с корректным aspect ratio и правильной ориентацией занимает несколько сотен строк кода.

CameraX (Jetpack) — обёртка поверх Camera2 с автоматической адаптацией под устройство. Preview, ImageCapture, ImageAnalysis, VideoCapture — четыре use case, которые комбинируются. Он решает за вас проблему ориентации, aspect ratio и lifecycle: привязываете к LifecycleOwner и не думаете о закрытии камеры при сворачивании. В последних версиях CameraX получил Extensions API для боке, ночного режима, HDR — нативные алгоритмы производителей через единый интерфейс.

Когда нужен Camera2 напрямую: RAW-съёмка через ImageFormat.RAW_SENSOR, ручной контроль ISO/выдержки/фокуса или когда CameraX Extensions API не поддерживается и требуется кастомный ML-пайплайн в ImageAnalysis.

На iOS AVFoundation — единственный путь для кастомной камеры. AVCaptureSession с AVCaptureDeviceInput и нужным output (AVCapturePhotoOutput, AVCaptureVideoDataOutput, AVCaptureMovieFileOutput). Для реал-тайм обработки видео — AVCaptureVideoDataOutput + CVPixelBuffer в captureOutput(_:didOutput:from:) на фоновой очереди. Именно тут CoreML-модели получают кадры для инференса.

Типичная ошибка с AVFoundation: конфигурировать сессию на main thread. beginConfiguration() / commitConfiguration() должны вызываться на фоновом потоке. Иначе preview фризит, пользователь видит заморозку интерфейса. Эта ошибка встречается в 70% проектов, которые мы аудировали.

Почему AudioFocus критичен для Android приложений

Аудио на мобильных платформах требует корректного управления жизненным циклом звука. AudioFocus — механизм координации между приложениями. AudioManager.requestAudioFocus() с OnAudioFocusChangeListener. Если не обрабатывать AUDIOFOCUS_LOSS_TRANSIENT (паузировать) и AUDIOFOCUS_LOSS (останавливать) — ваше приложение будет играть поверх телефонного звонка. Это гарантированный плохой отзыв в Google Play. Android Developer Guide: AudioFocus

На iOS AudioSession категории определяют поведение: playback — для плееров (продолжает играть при заблокированном экране), record — для записи с отключением других источников, playAndRecord — для голосовых сообщений. Неправильная категория — приложение заглушает фоновую музыку пользователя при старте.

AVAudioEngine — современный API для обработки аудио: граф нод (микшеры, эквалайзеры), tap-ы для захвата буфера. Для речи в реальном времени — SFSpeechRecognizer + inputNode.installTap.

На Android для записи с шумоподавлением — NoiseSuppressor.isAvailable() + create(audioRecord.audioSessionId). Работает не на всех устройствах, нужен fallback.

Видео: воспроизведение и стриминг

ExoPlayer (Media3) — стандарт для Android. Поддерживает HLS, DASH, SmoothStreaming, прогрессивное воспроизведение. DefaultTrackSelector с Parameters позволяет выбирать качество вручную или адаптивно. DRM через DefaultDrmSessionManager с Widevine L1/L3.

Проблема, с которой сталкиваются почти все: ExoPlayer в RecyclerView при быстром скролле. Нужен PlayerPool — пул переиспользуемых плееров. Без пула каждый новый экземпляр создаёт MediaCodec инстанс, что дорого и приводит к MediaCodec$CodecException: Error -19 на некоторых Android 10 устройствах при >3 одновременных инстансах.

AVPlayer / AVPlayerViewController на iOS — для воспроизведения. Для кастомного UI — AVPlayerLayer + собственные контролы. HLS работает нативно через AVPlayer(url:) с m3u8. FairPlay DRM требует серверной части: AVContentKeySession, CKC-ответ от KSM-сервера, делегат ресурсов.

Для Flutter — video_player как базовый слой, chewie для UI. Для серьёзных задач — platform channel к нативному ExoPlayer/AVPlayer (из-за DRM и субтитров).

Протокол	Задержка	Применение
RTMP	2–5 сек	Стриминг на YouTube/Twitch
HLS	6–30 сек	VOD, широковещательный
DASH	6–30 сек	VOD с адаптивным битрейтом
WebRTC	< 500 мс	Видеозвонки, P2P
SRT	1–4 сек	Профессиональный стриминг

WebRTC на мобильных — через нативные фреймворки или flutter_webrtc. Реальная сложность — не в самом протоколе, а в сигналинге и TURN-серверах. Без TURN клиенты за симметричными NAT не установят соединение — это примерно 15–20% трафика. Coturn — стандартный open-source сервер.

RTMP публикация на мобильных: LFLiveKit для iOS, HaishinKit как более современная альтернатива. На Android — rtmp-rtsp-stream-client-java или через FFmpeg с JNI. Последнее даёт максимальную гибкость, но бинарник растёт на 10–15 МБ.

Обработка медиа: компрессия и транскодирование

Видео в ProRes может занимать 6 ГБ/минуту. Перед загрузкой нужна компрессия. На iOS — AVAssetExportSession с пресетом 1920×1080 или кастомный AVVideoComposition. VideoToolbox для аппаратного кодирования H264/HEVC — быстрее и экономнее по батарее.

На Android — MediaCodec напрямую или Transformer (Media3) — высокоуровневый API для трансформаций (обрезка, ресайз, эффекты через GlEffectsFrameProcessor). Для изображений — BitmapFactory.Options.inSampleSize для даунсемплинга, Glide / Coil для кеширования. Coil на Coroutines хорошо вписывается в Compose. Загружать оригинал 12 МП в ImageView 200×200dp — классический OutOfMemoryError на устройствах с 2 ГБ RAM.

Как реализовать стриминг на мобильных устройствах: пошаговый план

Определить требования: целевая задержка, количество одновременных пользователей, необходимость P2P.
Выбрать протокол и стек: WebRTC для видеозвонков, RTMP/HLSLive для вещания.
Настроить сигналинг (SIP, WebSocket, MQTT) и TURN-сервер.
Реализовать публикацию/просмотр через нативный API или кроссплатформенный плагин.
Провести тестирование на реальных устройствах с разными камерами и сетевыми условиями.
Оптимизировать битрейт и разрешение в зависимости от пропускной способности.

Типичные ошибки при разработке медиа-функциональности

Конфигурация AVFoundation сессии на главном потоке.
Отсутствие обработки AudioFocus Loss на Android.
Игнорирование MediaCodec ограничений на дешёвых устройствах.
Использование эмулятора для тестов камеры — эмулятор не воспроизводит проблемы HAL.
Утечка памяти при пересоздании медиаплееров без пула.

Что входит в работу

Deliverable	Описание
Анализ требований	Выбор стека, приоритетов, тестовых устройств
Проектирование	Архитектура, диаграммы потоков данных, выбор API
Реализация	Код с использованием выбранных инструментов
Интеграция с бэкендом	GraphQL/REST, DRM, WebRTC сигналинг
Тестирование	На реальных устройствах (не менее 5 моделей)
Документация	API-документация, инструкция по сборке
Поддержка после релиза	1 месяц инцидентной поддержки, обучение команды

Процесс разработки медиафункциональности

Сложность нелинейна: базовое воспроизведение видео — 1–2 дня, кастомная камера с обработкой кадров и стримингом — 3–5 недель. Начинаем с прояснения требований: DRM, форматы, минимальная OS, поддержка фоновых режимов. Тестирование на железе обязательно — эмулятор не воспроизводит проблемы с Camera HAL, аппаратным кодеком и AudioFocus. Минимальный набор: последний iPhone, iPhone SE, флагман Samsung, бюджетный Android, Android Go (если целевая аудитория — развивающиеся рынки).

Сроки ориентировочно: от 5 рабочих дней (базовое воспроизведение) до 8 недель (комплексная камера со стримингом и DRM). Стоимость рассчитывается индивидуально после анализа ваших требований — свяжитесь с нами для консультации.

Фраза услуги: «Работа с медиа в мобильных приложениях» — это наш профиль. Каждый проект начинается с аудита текущей реализации, выявления узких мест и предложения оптимального стека.

Коммерческие сигналы: закажите аудит вашей медиа-функциональности, получите консультацию инженера без обязательств.