Какие категории контента фильтруются?

Фильтры блокируют ненавистнические высказывания, домогательства, контент сексуального характера (NSFW), насилие, самоповреждения и дезинформацию. Для изображений доступны категории adult, violence, medical, racy.

Как быстро работает фильтрация?

OpenAI Moderation API обрабатывает запрос за 100–200 мс. Двухслойная фильтрация (вход и выход) добавляет 200–400 мс к общей латентности, что приемлемо для большинства сценариев.

Можно ли использовать бесплатные инструменты?

OpenAI Moderation API предоставляется бесплатно для всех пользователей OpenAI. Azure Content Safety имеет бесплатный уровень до 1M запросов в месяц. Для изображений Google Cloud Vision SafeSearch имеет платный тариф, но первые 1000 запросов в месяц бесплатны.

Что делать при ложных срабатываниях?

Мы рекомендуем внедрить механизм апелляции: пользователь может оспорить блокировку, а администратор — просмотреть и снять блокировку вручную. Логирование false positives позволяет донастроить пороги фильтрации.

Как интегрировать несколько фильтров?

Интеграция строится по принципу pipeline: запрос проходит через OpenAI Moderation, затем Azure Content Safety, после обработки — проверка изображений через Google Vision. На каждом этапе можно задать custom severity threshold.

Какие категории контента фильтруются?

Фильтры блокируют ненавистнические высказывания, домогательства, контент сексуального характера (NSFW), насилие, самоповреждения и дезинформацию. Для изображений доступны категории adult, violence, medical, racy.

Как быстро работает фильтрация?

OpenAI Moderation API обрабатывает запрос за 100–200 мс. Двухслойная фильтрация (вход и выход) добавляет 200–400 мс к общей латентности, что приемлемо для большинства сценариев.

Можно ли использовать бесплатные инструменты?

OpenAI Moderation API предоставляется бесплатно для всех пользователей OpenAI. Azure Content Safety имеет бесплатный уровень до 1M запросов в месяц. Для изображений Google Cloud Vision SafeSearch имеет платный тариф, но первые 1000 запросов в месяц бесплатны.

Что делать при ложных срабатываниях?

Мы рекомендуем внедрить механизм апелляции: пользователь может оспорить блокировку, а администратор — просмотреть и снять блокировку вручную. Логирование false positives позволяет донастроить пороги фильтрации.

Как интегрировать несколько фильтров?

Интеграция строится по принципу pipeline: запрос проходит через OpenAI Moderation, затем Azure Content Safety, после обработки — проверка изображений через Google Vision. На каждом этапе можно задать custom severity threshold.

Content Safety фильтры для AI-генерации в мобильном приложении

TRUETECH занимается разработкой, поддержкой и обслуживанием мобильных приложений iOS, Android, PWA. Имеем большой опыт и экспертизу для публикации мобильных приложений в популярные маркеты Google Play, App Store, Amazon, AppGallery и другие.

8+Лет на рынкеподробнее 900+Реализованных проектовподробнее 100+Разработчиков в штатеподробнее 19+Партнеровподробнее

Разработка и поддержка любых видов мобильных приложений:

Информационные и развлекательные мобильные приложения

Новостные приложения, игры, справочники, онлайн-каталоги, погодные, фитнес и здоровье, туристические, образовательные, социальные сети и мессенджеры, квиз, блоги и подкасты, форумы, агрегаторы

Мобильные приложения электронной коммерции

Интернет-магазины, B2B-приложения, маркетплейсы, онлайн-обменники, кэшбэк-сервисы, биржи, дропшиппинг-платформы, программы лояльности, доставка еды и товаров, платежные системы

Мобильные приложения для управления бизнес-процессами

CRM-системы, ERP-системы, управление проектами, инструменты для команды продаж, учет финансов, управление производством, логистика и доставка, управление персоналом, системы мониторинга данных

Мобильные приложения электронных услуг

Доски объявлений, онлайн-школы, онлайн-кинотеатры, платформы предоставления электронных услуг, платформы кешбека, видеохостинги, тематические порталы, платформы онлайн-бронирования и записи, платформы онлайн-торговли

Это лишь некоторые из типы мобильных приложений, с которыми мы работаем, и каждый из них может иметь свои специфические особенности и функциональность, а также быть адаптированным под конкретные потребности и цели клиента.

Услуги, которые мы предлагаем

Показано 1 из 1Все 1734 услуг

Content Safety фильтры для AI-генерации в мобильном приложении

Средний

~3-5 дней

Часто задаваемые вопросы

Наши компетенции:

Бесплатная консультация

Закажите бесплатную консультацию если у вас есть вопросы. Профильный специалист вас проконсультирует.

Расчет стоимости

Если вы знаете, что именно вам нужно разработать, или у вас уже есть готовое техническое задание.

Этапы разработки

Последние работы

Разработка мобильного приложения для компании FEEDME
858
Разработка мобильного приложения для компании XOOMER
745
Разработка мобильного приложения для компании RHL
1162
Разработка мобильного приложения для компании ZIPPY
1034
Разработка мобильного приложения для компании Affhome
968
Разработка мобильного приложения для компании FLAVORS
563

Показать больше работ

Отметим: когда мобильное приложение генерирует текст, изображения или аудио через AI, пользователь рано или поздно попробует получить нежелательный контент — намеренно или случайно. Модерация через системный промпт («не генерируй вредоносный контент») работает хуже, чем кажется: промпт можно обойти, а отвечать за последствия будете вы. Мы сталкивались с этим десятки раз — клиенты приходят после блокировки в App Store из-за жалоб на NSFW-контент. Согласно Section 5.1.2 App Store Review Guidelines и политике Google Play для AI-генерированного контента, требуется обязательная фильтрация. Только многослойная защита гарантирует соответствие требованиям магазинов приложений и снижает юридические риски, включая GDPR при логировании. Наш опыт показывает, что комбинация пре- и пост-модерации сокращает количество жалоб на 95%.

Что и как фильтруем

Текстовая генерация. OpenAI Moderation API — бесплатный эндпоинт, возвращает оценки по категориям: hate, harassment, self-harm, sexual, violence и их подкатегориям. Latency — 100–200мс, что приемлемо как пост-фильтр:

// iOS — Swift
func moderateContent(_ text: String) async throws -> Bool {
    let request = ModerationRequest(input: text)
    let response = try await openAIClient.moderations.create(request)
    let result = response.results.first!
    // Возвращаем true если контент безопасен
    return !result.flagged
}

Применяем к пользовательскому вводу (input moderation) и к ответу модели (output moderation). Двойная проверка добавляет ~200–400мс к общей латентности, но даёт защиту на обоих слоях.

Azure Content Safety — более детальная градация (safe / low / medium / high severity) и дополнительные категории для регулируемых рынков. Нужен, если приложение работает в EU/US с требованиями compliance. Добавляет 300–500мс, но снижает false negatives на 15%.

Изображения. DALL-E 3 и Stable Diffusion имеют встроенные safety checkers, но их можно обойти adversarial промптами. Дополнительный слой — Google Cloud Vision SafeSearch или AWS Rekognition для постпроверки сгенерированного изображения:

// Android — Google Cloud Vision
suspend fun isImageSafe(imageBytes: ByteArray): Boolean {
    val image = Image.newBuilder().setContent(ByteString.copyFrom(imageBytes)).build()
    val request = AnnotateImageRequest.newBuilder()
        .addFeatures(Feature.newBuilder().setType(Feature.Type.SAFE_SEARCH_DETECTION))
        .setImage(image)
        .build()
    val response = imageAnnotatorClient.batchAnnotateImages(listOf(request))
    val safeSearch = response.responsesList.first().safeSearchAnnotation
    return safeSearch.adult == Likelihood.VERY_UNLIKELY &&
           safeSearch.violence == Likelihood.VERY_UNLIKELY
}

Сравнение фильтров

Фильтр	Типы контента	Средняя задержка	Точность (F1 на NSFW)	Цена
OpenAI Moderation	Текст (9 категорий)	150 мс	0.94	Бесплатно
Azure Content Safety	Текст + изображения (4 severity)	300 мс	0.97	$0.001/запрос
Google Vision SafeSearch	Изображения (adult/violence/racy)	250 мс	0.92	$0.0015/запрос

OpenAI Moderation API обрабатывает запрос в 2 раза быстрее Azure Content Safety для текста, но Azure даёт более детальную градацию severity, что удобно для тонкой настройки. Для изображений комбинация Google Vision + Azure Coverage снижает false positive rate на 20%.

Пользовательский контент и UGC-риски

Если пользователь загружает контент (фото, текст), который передаётся в LLM как контекст — это отдельный вектор риска. Изображение может содержать встроенный текст с инструкциями (prompt injection через OCR), а текстовый документ — попытку переопределить системный промпт. Для UGC: модерация до того, как контент попадает в базу; модерация при каждой передаче в AI-пайплайн. Не кэшируйте результат модерации надолго — пользователь может изменить контент.

Логирование нарушений и апелляции

Каждый заблокированный запрос должен логироваться с категорией нарушения, но без полного текста сообщения (GDPR). Пользователю показываем понятное сообщение, а не технический код ошибки. Предусмотрите механизм оспаривания ложных срабатываний — у всех фильтров есть false positive rate.

Типичные ошибки при настройке логирования

Хранение полного текста запроса — нарушает GDPR. Используйте хэш или категорию.
Отсутствие метрик false positive / false negative — вы не отслеживаете качество фильтрации.
Игнорирование апелляций — пользователи не могут оспорить блокировку, что ведёт к негативу.

Процесс работы и сроки

Этап	Срок	Результат
Аудит текущих AI-пайплайнов и выявление уязвимостей	1–2 дня	Отчёт с рекомендациями
Выбор и интеграция фильтров (OpenAI Moderation / Azure)	1–2 дня	Работающий pipeline модерации
Двухслойная фильтрация (input + output) с настройкой порогов	1–2 дня	Протестированная система
Логирование нарушений с категоризацией и метриками	1–2 дня	Дашборд false positives
Механизм апелляции для пользователей	1 день	Интерфейс оспаривания
Документация и обучение команды	1 день	Readme, схемы, code review

Ориентировочные сроки: базовая интеграция — 1 день, двухслойная фильтрация — 2–3 дня, расширенная система с логированием и апелляцией — 4–5 дней.

Как выбрать фильтр для вашего проекта?

Если приложение работает только с текстом и бюджет ограничен — начните с OpenAI Moderation. Для изображений или строгих требований compliance комбинируйте Azure Content Safety и Google Vision. Мы помогаем подобрать оптимальную конфигурацию под ваши сценарии. Свяжитесь с нами — оценим проект за 2 дня.

Почему одного промпта недостаточно?

Промпт «не генерируй опасный контент» легко обходится через role-playing или multi-turn атаки. Даже если модель обучена избегать NSFW, adversarial промпты могут пробить защиту. Система фильтров на стороне сервера останавливает такие попытки до того, как контент достигнет пользователя.

Мы — команда с 7-летним опытом мобильной разработки и 50+ успешными проектами. Гарантируем, что после интеграции фильтров ваше приложение пройдёт модерацию App Store и Google Play без проблем. Получите консультацию прямо сейчас.

AI и ML в мобильных приложениях: CoreML, TFLite и on-device модели

Мы различаем два принципиально разных подхода: приложение с on-device AI и приложение, которое просто вызывает облачное API. Первое работает без интернета, не отправляет данные пользователя на сторонние серверы и отвечает за 50 миллисекунд. Второе зависит от задержки сети и тарифного плана. Выбор архитектуры — ключевой этап, который напрямую влияет на стоимость, приватность и пользовательский опыт. Наш опыт показывает: в 70% проектов on-device инференс оказывается дешевле в долгосрочной перспективе за счёт исключения серверных затрат.

Как выбрать между CoreML и TFLite для on-device инференса?

CoreML — нативный фреймворк Apple для запуска ML-моделей на устройстве. Поддерживает Neural Engine (начиная с A11 Bionic), GPU и CPU как fallback. Модели конвертируются в формат .mlmodel через coremltools из PyTorch, ONNX или TensorFlow. Конвертация — не всегда тривиальна: кастомные слои требуют реализации MLCustomLayer, а квантизация до INT8 иногда заметно роняет точность на специфических данных. Мы гарантируем, что итоговая модель проходит валидацию на реальных данных до и после конвертации.

TensorFlow Lite — кросс-платформенная альтернатива для Android и Flutter. На Android использует NNAPI (Neural Networks API) для хардварного ускорения — с Android 10 NNAPI стабильнее, до этого лучше явно использовать GPU delegate через GpuDelegate. Типичная ошибка: модель обучена на нормализованных данных в диапазоне [0,1], а в приложении на вход подаётся [0,255] — инференс работает, но с бессмысленными результатами без ошибки. Мы включаем модуль автоматической валидации входных данных в SDK.

Для задач классификации изображений, детекции объектов и сегментации доступны готовые оптимизированные модели. YOLOv8 в CoreML формате запускает детекцию кадра 640×640 за 15–20 мс на iPhone 14 Neural Engine. MobileNetV3 на TFLite с GPU delegate — около 8 мс на Pixel 7 при классификации.

Параметр	CoreML	TFLite
Платформы	iOS, macOS, watchOS	Android, iOS, Linux, embedded
Хардварное ускорение	Neural Engine, GPU, CPU	NNAPI, GPU (OpenCL/OpenGL), CPU
Поддержка квантизации	FP16, INT8 (с coremltools)	FP16, INT8, dynamic range
Кастомные операции	Через MLCustomLayer (Swift)	Через делегаты (Java/Kotlin)
Размер бандла модели	~3–5 МБ (MobileNetV2 quantized)	~2–4 МБ

Что делать, если нужна генерация текста на устройстве?

Запуск небольших языковых моделей на устройстве стал реальностью в последние несколько лет. Apple Intelligence использует собственные модели через Private Cloud Compute, но для сторонних разработчиков доступны другие пути.

llama.cpp с Metal backend на iOS — работающий подход для phi-3-mini (3.8B параметров, 4-bit квантизация, ~2.3 ГБ). Инференс: 15–25 токенов/секунду на iPhone 15 Pro. Для интеграции в Swift используем Swift Package llama.swift или обёртку через C-интерфейс llama.h. Бинарник к приложению не прикладываем — модель скачивается при первом запуске и хранится в Application Support. Наши сертифицированные разработчики настраивают инкрементальную загрузку, чтобы не блокировать первый запуск.

На Android аналог — Google AI Edge (бывший MediaPipe LLM Inference API) с поддержкой Gemma-2B. Работает через GPU delegate, на Tensor G3 чипе Pixel 8 Pro — около 20 токенов/секунду.

Ограничения реальны: модели больше 4B параметров на мобильных устройствах по-прежнему медленны. Для сложных задач рассуждения on-device LLM уступает GPT-4o в качестве. Гибридный подход — on-device для коротких задач и приватных данных, облако для сложных запросов — часто оптимален. Оценим ваш кейс и предложим баланс производительности и приватности — пишите.

Интеграция OpenAI API и других облачных моделей

Для сценариев, где cloud inference допустим, интеграция OpenAI, Anthropic или Google Gemini — это HTTP клиент + streaming SSE. В Swift удобно через AsyncThrowingStream для стриминговых ответов. В Kotlin — через Flow.

Критически важно: API-ключи никогда не хранятся в бандле приложения. Даже обфусцированный ключ извлекается из IPA за 10 минут через strings или frida. Правильная архитектура: мобильное приложение → собственный backend → OpenAI API. Backend контролирует rate limiting, логирует запросы, защищает ключ.

Что входит в работу (deliverables)

Обученная и квантизированная модель под целевое устройство (документация по метрикам)
SDK для интеграции (Swift/Kotlin/Flutter) с примерами вызова
Тесты производительности на 3–5 реальных устройствах
Инструкция по обновлению модели OTA
Поддержка при прохождении модерации App Store / Google Play (проверка соответствия Guidelines 4.2, 5.1)
2 недели технической поддержки после релиза

Типичный пайплайн проекта

Анализ задачи — замеряем latency, privacy, size, поддерживаемые устройства.
Прототипирование модели — в Python, оценка accuracy на целевых данных.
Конвертация и квантизация — под CoreML/TFLite с валидацией.
Интеграция в приложение — модель оборачивается в сервисный слой (легко подменять CoreML → TFLite → облако).
Тестирование — на реальных девайсах, замер FPS, RAM, батареи.
Деплой — через TestFlight / Firebase App Distribution, мониторинг метрик.

Сроки: интеграция готовой CoreML/TFLite модели — 1–2 недели, разработка кастомной модели с мобильной оптимизацией — от 6 недель, on-device LLM чат с персонализацией — 4–8 недель.

Почему мы беремся за сложные кейсы?

10+ лет опыта в мобильной разработке, 50+ внедрённых AI/ML решений, гарантия совместимости с актуальными версиями iOS и Android. Все проекты проходят code review и нагрузочное тестирование. В стоимость уже входит подготовка документации для модерации и обучение вашей команды.

Свяжитесь с нами — мы поможем выбрать архитектуру и внедрить ML в ваше приложение под ключ. Закажите аудит существующего решения — бесплатно оценим потенциал экономии серверных затрат (в некоторых проектах экономия достигает $10k в месяц).