Реализация режима co-streaming (совместный стрим) в мобильном приложении
Co-streaming — это когда два пользователя транслируют одновременно, видят и слышат друг друга в реальном времени, и зрители видят обоих. Технически это пересечение двух разных задач: WebRTC (для peer-to-peer видеосвязи между стримерами) и RTMP/SRT (для трансляции результата зрителям). Объединить их нетривиально.
Архитектура co-стрима
Стандартная схема:
Стример A: камера → WebRTC → Сигнальный сервер ← WebRTC ← камера: Стример B
↓
Mixing Server (SFU/MCU)
↓
RTMP → Twitch/YouTube/Custom
Но на мобиле добавляется вариант без MCU — «client-side mixing». Стример A получает видео стримера B через WebRTC, смешивает оба потока локально через Metal/OpenGL и отправляет смешанный стрим на RTMP. Это дешевле серверно, но требует мощного процессора на устройстве и нестабильно при плохой сети второго участника.
В продакшене для приложений с 1000+ одновременных co-стримов — только серверный MCU/SFU (LiveKit, mediasoup, Agora). Для MVP с небольшой нагрузкой — client-side mixing работает.
WebRTC на iOS и Android
iOS: GoogleWebRTC (CocoaPods) или WebRTC.xcframework от Google. Основной объект — RTCPeerConnection. Инициализация:
let config = RTCConfiguration()
config.iceServers = [RTCIceServer(urlStrings: ["stun:stun.l.google.com:19302"],
username: nil, credential: nil)]
config.sdpSemantics = .unifiedPlan
let constraints = RTCMediaConstraints(
mandatoryConstraints: ["OfferToReceiveVideo": "true",
"OfferToReceiveAudio": "true"],
optionalConstraints: nil
)
let peerConnection = factory.peerConnection(with: config,
constraints: constraints,
delegate: self)
Android: org.webrtc:google-webrtc:1.0.+ или io.getstream:stream-webrtc-android. Логика аналогичная через PeerConnection.
Сигнальный сервер — WebSocket, который обменивает SDP offer/answer и ICE candidates между стримерами. Пишем на Node.js (ws) или используем готовый — LiveKit Server, Agora RTM.
Проблемы, с которыми сталкиваемся
Задержка аудио при смешивании. Когда A слышит B через WebRTC с задержкой 150–200ms, а стрим формируется из локального аудио A, зрители слышат рассинхрон. Решение: компенсация задержки через AVAudioPlayerNode.scheduleBuffer с явным AVAudioTime, чтобы локальное аудио A в итоговом стриме было задержано на то же время, что и входящее от B.
Echo cancellation. Если у стримера нет наушников, его микрофон захватывает звук из динамика (WebRTC-аудио от партнёра). WebRTC встроенный AEC работает только на RTCPeerConnection-аудио треке. При кастомном аудиопайплайне нужен AVAudioEngine с AVAudioUnitEQ + собственный AEC или speex DSP.
Переключение между co-стримом и solo. При выходе партнёра из co-стрима нужно плавно убрать его окно из композиции и перестроить layout без прерывания RTMP-трансляции. Это означает: Metal render pass должен проверять наличие второй текстуры и корректно рендерить full-frame режим, если второй участник отключился.
Сигнализация состояния для зрителей
Зрители должны знать, что идёт co-стрим. На стороне приложения — overlay с аватарами обоих стримеров. Обновление overlay при изменении состояния (партнёр подключился/отключился) идёт через WebSocket-событие, не через polling.
Сроки
Client-side co-стрим (iOS, два участника, Metal-композиция, базовый сигнальный сервер): 5–7 недель. Полная реализация с MCU, Android-поддержкой, AEC, управлением состоянием: 8–12 недель. Стоимость рассчитывается индивидуально после анализа требований и выбора архитектуры.







