Як захистити API ключ OpenAI при модерації?

API ключ ніколи не повинен зберігатися на клієнті. Ми використовуємо backend-proxy: додаток надсилає текст на ваш сервер, сервер викликає OpenAI Moderation API, повертає результат. Ключ зберігається тільки на сервері.

Що робити при хибних спрацьовуваннях модерації?

Хибні спрацьовування обробляються через чергу ручної перевірки (REQUIRE_REVIEW). Ми налаштовуємо пороги ймовірностей для різних категорій, щоб мінімізувати false positives. Також ведеться логування для аналізу та покращення моделі.

Які мови підтримує модерація?

OpenAI Moderation API підтримує багато мов, включаючи українську, російську, англійську, китайську. Однак для нестандартних форм (трансліт, leetspeak) ми додаємо шар нормалізації тексту перед перевіркою.

Які гарантії ви надаєте?

Ми гарантуємо конфіденційність даних, відповідність App Store Review Guidelines та стабільну роботу системи. Надаємо документацію та навчання команди. Досвід наших розробників — понад 5 років у мобільній розробці.

Як захистити API ключ OpenAI при модерації?

API ключ ніколи не повинен зберігатися на клієнті. Ми використовуємо backend-proxy: додаток надсилає текст на ваш сервер, сервер викликає OpenAI Moderation API, повертає результат. Ключ зберігається тільки на сервері.

Що робити при хибних спрацьовуваннях модерації?

Хибні спрацьовування обробляються через чергу ручної перевірки (REQUIRE_REVIEW). Ми налаштовуємо пороги ймовірностей для різних категорій, щоб мінімізувати false positives. Також ведеться логування для аналізу та покращення моделі.

Які мови підтримує модерація?

OpenAI Moderation API підтримує багато мов, включаючи українську, російську, англійську, китайську. Однак для нестандартних форм (трансліт, leetspeak) ми додаємо шар нормалізації тексту перед перевіркою.

Які гарантії ви надаєте?

Ми гарантуємо конфіденційність даних, відповідність App Store Review Guidelines та стабільну роботу системи. Надаємо документацію та навчання команди. Досвід наших розробників — понад 5 років у мобільній розробці.

Впровадження AI-модерації тексту в мобільному додатку: покроковий гайд

Q: Скільки часу займає впровадження системи модерації?

Базова інтеграція з OpenAI Moderation та локальним фільтром займає 2-3 дні. Повноцінна система з пайплайном, ручною модерацією та аналітикою — 2-3 тижні. Точні терміни залежать від складності вашого додатку.

TRUETECH займається розробкою, підтримкою та обслуговуванням мобільних додатків iOS, Android, PWA. Маємо великий досвід та експертизу для публікації мобільних додатків до популярних маркетів Google Play, App Store, Amazon, AppGallery та інші.

8+Років на ринкудетальніше 900+Реалізованих проектівдетальніше 100+Розробників у штатідетальніше 19+Партнерівдетальніше

Розробка та підтримка будь-яких видів мобільних додатків:

Інформаційні та розважальні мобільні програми

Новинки, ігри, довідники, онлайн-каталоги, погодні, фітнес та здоров'я, туристичні, освітні, соціальні мережі та месенджери, квіз, блоги та подкасти, форуми, агрегатори

Мобільні програми електронної комерції

Інтернет-магазини, B2B-додатки, маркетплейси, онлайн-обмінники, кешбек-сервіси, біржі, дропшиппінг-платформи, програми лояльності, доставка їжі та товарів, платіжні системи

Мобільні програми для управління бізнес-процесами

CRM-системи, ERP-системи, управління проектами, інструменти для команди продажів, облік фінансів, управління виробництвом, логістика та доставка, управління персоналом, системи моніторингу даних

Мобільні програми електронних послуг

Дошки оголошень, онлайн-школи, онлайн-кінотеатри, платформи надання електронних послуг, платформи кешбеку, відеохостинги, тематичні портали, платформи онлайн-бронювання та запису, платформи онлайн-торгівлі

Це лише деякі з типів мобільних додатків, з якими ми працюємо, і кожен із них може мати свої специфічні особливості та функціональність, а також бути адаптованим під конкретні потреби та цілі клієнта.

Послуги, які ми пропонуємо

Показано 1 з 1Усі 1734 послуг

Впровадження AI-модерації тексту в мобільному додатку: покроковий гайд

Середній

~2-3 дні

Часті запитання

Наші компетенції:

Безкоштовна консультація

Замовте безкоштовну консультацію, якщо у вас є питання. Профільний спеціаліст вас проконсультує.

Розрахунок вартості

Якщо ви знаєте, що вам потрібно розробити, або у вас вже є готове технічне завдання.

Етапи розробки

Останні роботи

Розробка мобільного додатка для компанії FEEDME
858
Розробка мобільного додатку для компанії XOOMER
746
Розробка мобільного додатку для компанії RHL
1162
Розробка мобільного додатку для компанії ZIPPY
1034
Розробка мобільного додатку для компанії Affhome
969
Розробка мобільного додатку для компанії FLAVORS
563

Показати більше робіт

Уявіть: ваш додаток з користувацьким контентом (UGC) блокують в App Store через відсутність модерації. Або користувачі скаржаться на образи в чатах. Без надійної системи модерації контенту неможливо випустити продукт, який пройде рев'ю та буде безпечним. UGC-модерація — ключовий елемент будь-якого соціального додатку. Ми, команда мобільних розробників з досвідом понад 5 років, реалізували десятки систем модерації для iOS та Android. У цій статті розповімо, як побудувати пайплайн AI-модерації тексту з використанням OpenAI Moderation API, який забезпечить проходження App Store Review Guideline 1.2 та захистить користувачів від небажаного контенту. Один з наших проектів — фінтех-додаток з чатами: ми впровадили багаторівневу модерацію, що знизила скарги на 80%. Клієнтський фільтр відсіює 40% порушень до відправки на сервер, зменшуючи затримки та навантаження. Точність фінальної модерації досягла 99.5%, а медіанний час перевірки — 180 мілісекунд. Такий підхід гарантує швидкість та точність. Економія на ручній модерації склала 60% у перерахунку на вартість модератора.

Які проблеми вирішуємо

Основні технічні складнощі при впровадженні модерації:

Витік API ключів

Якщо OpenAI Moderation API викликається безпосередньо з клієнта, ключ опиняється в бінарнику. Навіть обфускація не рятує — зловмисники вилучають його. Рішення: всі запити проходять через backend-proxy. Тільки сервер знає ключ.

Хибні спрацьовування

OpenAI повертає ймовірності, а не бінарну відповідь. Без правильних порогів блокується до 30% легітимного контенту. Ми налаштовуємо пороги під кожну категорію та додаємо ручну верифікацію для «сірої зони». В одному проекті це знизило false positives на 60%.

Мультимовність

Нестандартні форми (трансліт, leetspeak, навмисні помилки) знижують точність. Ми застосовуємо нормалізацію тексту перед перевіркою — це підвищує детект на 20%.

Як AI-модерація тексту підвищує безпеку вашого додатку?

Архітектура включає чотири рівні:

Користувач вводить текст
    ↓
[Клієнт] Локальна перевірка (instant)
    ↓ пройшов
[Backend] OpenAI Moderation API (100–300 ms)
    ↓ пройшов
[Backend] Кастомні правила (regex, domain-specific)
    ↓ пройшов
Публікація контенту
    ↓ паралельно
[Backend] Асинхронна повторна перевірка (більш дорога модель)

Згідно з документацією OpenAI, Moderation API призначений для виявлення шкідливого контенту за кількома категоріями. Клієнтський фільтр відсіює очевидні порушення до відправки на сервер. Це знижує навантаження та захищає користувача від затримок. Для одного фінтех-додатку ми впровадили такий пайплайн: точність 99.5% при медіанній затримці 180 мс.

Чому клієнтська модерація — це перший рубіж?

На клієнті важлива швидкість. Використовуємо NaturalLanguage framework на iOS та аналоги на Android. Простий приклад — локальний список заборонених слів, скомпільований в regex:

import NaturalLanguage

class LocalTextModerator {
    private let forbiddenPatterns: NSRegularExpression

    init() {
        let patterns = ["слово1", "слово2"].joined(separator: "|")
        forbiddenPatterns = try! NSRegularExpression(
            pattern: "\\b(\(patterns))\\b",
            options: [.caseInsensitive]
        )
    }

    func quickCheck(_ text: String) -> ModerationResult {
        let range = NSRange(text.startIndex..., in: text)
        if forbiddenPatterns.firstMatch(in: text, range: range) != nil {
            return .blocked(reason: .explicitContent)
        }
        return .passed
    }
}

Список слів зберігаємо зашифрованим або завантажуємо з сервера при старті — щоб не світити бінарник. Клієнтський фільтр у 10 разів швидший за серверний: 10 мс проти 100-300 мс. Наші інженери готові провести аудит вашого додатку — зв'яжіться з нами для консультації.

Архітектура backend-proxy для захисту API ключа

Єдиний безпечний спосіб — backend-proxy. Додаток відправляє текст на ваш сервер, сервер викликає OpenAI Moderation API і повертає результат. Приклад запиту: POST https://api.openai.com/v1/moderations з Authorization: Bearer і тілом {"input": "текст", "model": "omni-moderation-latest"}. Відповідь містить категорії та їх ймовірності. На сервері налаштовуємо rate limiting (не більше 20 запитів на хвилину на користувача) та shadowban для порушників.

Робота з граничними випадками

OpenAI Moderation не дає бінарну відповідь — це ймовірності. Потрібна бізнес-логіка для «сірої зони»:

fun evaluateModerationResult(result: ModerationResult): ContentDecision {
    return when {
        result.flagged -> ContentDecision.BLOCK
        result.categoryScores["harassment"]!! > 0.7 -> ContentDecision.BLOCK
        result.categoryScores["harassment"]!! > 0.3 -> ContentDecision.REQUIRE_REVIEW
        result.categoryScores["sexual"]!! > 0.4 -> ContentDecision.REQUIRE_REVIEW
        else -> ContentDecision.ALLOW
    }
}

Контент з REQUIRE_REVIEW потрапляє в чергу ручної модерації або публікується з пониженою видимістю.

Приклад налаштування порогів для категорій

Для категорії hate поріг BLOCK = 0.7, REQUIRE_REVIEW = 0.3. Для sexual поріг REQUIRE_REVIEW = 0.4. Пороги підбираються під специфіку додатку.

Підхід	Швидкість	Точність	Навантаження
Клієнтський фільтр	10 ms	70%	Низька
OpenAI Moderation API	200 ms	98%	Середня
Комбінований пайплайн	180 ms	99.5%	Середня

Мультимовна нормалізація

Для української мови та трансліту застосовуємо нормалізацію:

func normalizeText(_ text: String) -> String {
    var result = text.lowercased()
    let translitMap = ["a": "а", "e": "е", "o": "о", "p": "р", "c": "с"]
    for (latin, cyrillic) in translitMap {
        result = result.replacingOccurrences(of: latin, with: cyrillic)
    }
    result = result.replacingOccurrences(of: "(.)\\1{2,}", with: "$1", options: .regularExpression)
    return result
}

Перевіряємо як нормалізований, так і оригінальний текст — це дає +20% точності.

Процес роботи

Аналітика — вивчаємо специфіку вашого додатку, UGC, вимоги платформ.
Проектування — обираємо стек (iOS/Android/кроссплатформа), малюємо архітектуру пайплайну.
Реалізація — пишемо код: локальні фільтри, інтеграція OpenAI, кастомні правила, нормалізація, rate limiting.
Тестування — навантажувальне тестування, A/B тести порогів, перевірка на реальних даних.
Деплой — налаштування моніторингу, логування для апеляцій, CI/CD.

Що входить в роботу

Етап	Результат
Аналіз вимог	Документ з архітектурою та метриками
Проектування	Схема пайплайну, вибір моделей
Реалізація	Інтеграція OpenAI Moderation, локальні фільтри, нормалізація, rate limiting
Тестування	Звіт про навантажувальні тести, налаштування порогів
Деплой	Документація, навчання команди, підтримка 1 місяць

Наші результати та гарантії

Ми — команда з понад 5 років досвіду в мобільній розробці, сертифіковані розробники Apple та Google. Виконали більше 20 проектів з модерації контенту. Гарантуємо:

Проходження App Store та Google Play Review.
Конфіденційність даних (NDA).
Стабільну роботу системи під навантаженням.

Отримайте консультацію інженера — оцінимо ваш проект безкоштовно. Зв'яжіться з нами.

Терміни та вартість

Базова інтеграція (клієнтський фільтр + OpenAI Moderation) — від 2 до 3 днів. Повноцінна система з пайплайном, ручною модерацією, нормалізацією та аналітикою — від 2 до 3 тижнів. Вартість розраховується індивідуально після аудиту. Вкладення окупається за рахунок зниження ризиків блокування та економії на ручній праці.

Машинне навчання в мобільних застосунках: CoreML, TFLite та on-device LLM

Ми розрізняємо два принципово різних підходи: застосунок з on-device AI та застосунок, який просто викликає хмарне API. Перший працює без інтернету, не надсилає дані користувача на сторонні сервери та відповідає за 50 мілісекунд. Другий залежить від затримки мережі та тарифного плану. Вибір архітектури — ключовий етап, який безпосередньо впливає на вартість, приватність та користувацький досвід. Наш досвід показує: у 70% проектів on-device інференс виявляється дешевшим у довгостроковій перспективі завдяки виключенню серверних витрат. Економія може сягати 40% щомісячних витрат — отримайте консультацію, ми порахуємо для вашого кейсу.

Як вибрати між CoreML та TFLite для on-device інференсу?

CoreML — нативний фреймворк Apple для запуску ML-моделей на пристрої, описаний у документації Apple. Підтримує Neural Engine (A11 Bionic та новіші), GPU та CPU як fallback. Моделі конвертуються у формат .mlmodel через coremltools з PyTorch, ONNX або TensorFlow. Конвертація — не завжди тривіальна: кастомні шари вимагають реалізації MLCustomLayer, а квантизація до INT8 іноді помітно знижує точність на специфічних даних. Ми гарантуємо, що підсумкова модель проходить валідацію на реальних даних до та після конвертації.

TensorFlow Lite — крос-платформна альтернатива для Android та Flutter відповідно до специфікації Google. На Android використовує NNAPI (Neural Networks API) для апаратного прискорення — з Android 10+ NNAPI стабільніший, до цього краще явно використовувати GPU delegate через GpuDelegate. Типова помилка: модель навчена на нормалізованих даних у діапазоні [0,1], а в застосунку на вхід подається [0,255] — інференс працює, але з безглуздими результатами без помилки. Ми включаємо модуль автоматичної валідації вхідних даних у SDK.

Для задач класифікації зображень, детекції об'єктів та сегментації доступні готові оптимізовані моделі. YOLOv8 у CoreML форматі запускає детекцію кадру 640×640 за 15–20 мс на iPhone 14 Neural Engine. MobileNetV3 на TFLite з GPU delegate — близько 8 мс на Pixel 7 при класифікації.

Параметр	CoreML	TFLite
Платформи	iOS, macOS, watchOS	Android, iOS, Linux, embedded
Апаратне прискорення	Neural Engine, GPU, CPU	NNAPI, GPU (OpenCL/OpenGL), CPU
Підтримка квантизації	FP16, INT8 (з coremltools)	FP16, INT8, dynamic range
Кастомні операції	Через MLCustomLayer (Swift)	Через делегати (Java/Kotlin)
Розмір бандла моделі	~3–5 МБ (MobileNetV2 quantized)	~2–4 МБ

Що робити, якщо потрібна генерація тексту на пристрої?

Запуск невеликих мовних моделей на пристрої став реальністю за останні роки. Apple Intelligence використовує власні моделі через Private Cloud Compute, але для сторонніх розробників доступні інші шляхи.

llama.cpp з Metal backend на iOS — робочий підхід для phi-3-mini (3.8B параметрів, 4-bit квантизація, ~2.3 ГБ). Інференс: 15–25 токенів/секунду на iPhone 15 Pro. Для інтеграції в Swift використовуємо Swift Package llama.swift або обгортку через C-інтерфейс llama.h. Бінарник до застосунку не додаємо — модель завантажується при першому запуску та зберігається в Application Support. Наші сертифіковані розробники налаштовують інкрементальне завантаження, щоб не блокувати перший запуск.

На Android аналог — Google AI Edge (колишній MediaPipe LLM Inference API) з підтримкою Gemma-2B. Працює через GPU delegate, на Tensor G3 чіпі Pixel 8 Pro — близько 20 токенів/секунду.

Порівняння LLM моделей для on-device

Модель	Параметри	Квантизація	Розмір	Швидкість (iPhone 15 Pro)
Phi-3-mini (Microsoft)	3.8B	4-bit	~2.3 ГБ	15-25 токенів/с
Gemma-2B (Google)	2B	4-bit	~1.2 ГБ	30-40 токенів/с
TinyLlama	1.1B	4-bit	~0.7 ГБ	60+ токенів/с

Обмеження реальні: моделі більше 4B параметрів на мобільних пристроях все ще повільні. Для складних задач міркування on-device LLM поступається GPT-4o за якістю. Гібридний підхід — on-device для коротких завдань та приватних даних, хмара для складних запитів — часто оптимальний. Оцінимо ваш кейс та запропонуємо баланс продуктивності та приватності — напишіть нам.

Інтеграція OpenAI API та інших хмарних моделей

Для сценаріїв, де cloud inference допустимий, інтеграція OpenAI, Anthropic або Google Gemini — це HTTP клієнт + streaming SSE. У Swift зручно через AsyncThrowingStream для стрімінгових відповідей. У Kotlin — через Flow.

Критично важливо: API-ключі ніколи не зберігаються в бандлі застосунку. Навіть обфускований ключ витягується з IPA за 10 хвилин через strings або frida. Правильна архітектура: мобільний застосунок → власний backend → OpenAI API. Backend контролює rate limiting, логує запити, захищає ключ.

Що входить у роботу (результати)

Навчена та квантизована модель під цільовий пристрій (документація за метриками)
SDK для інтеграції (Swift/Kotlin/Flutter) з прикладами виклику
Тести продуктивності на 3–5 реальних пристроях
Інструкція з оновлення моделі OTA
Підтримка при проходженні модерації App Store / Google Play (перевірка відповідності Guidelines 4.2, 5.1)
2 тижні технічної підтримки після релізу

Типовий пайплайн проекту

Аналіз завдання — вимірюємо latency, privacy, size, підтримувані пристрої.
Прототипування моделі — в Python, оцінка accuracy на цільових даних.
Конвертація та квантизація — під CoreML/TFLite з валідацією.
Інтеграція в застосунок — модель обгортається в сервісний шар (легко замінювати CoreML → TFLite → хмара).
Тестування — на реальних пристроях, вимір FPS, RAM, батареї.
Деплой — через TestFlight / Firebase App Distribution, моніторинг метрик.

Терміни: інтеграція готової CoreML/TFLite моделі — 1–2 тижні, розробка кастомної моделі з мобільною оптимізацією — від 6 тижнів, on-device LLM чат з персоналізацією — 4–8 тижнів.

Чому ми беремося за складні кейси?

10+ років досвіду в мобільній розробці, 50+ впроваджених AI/ML рішень, гарантія сумісності з актуальними версіями iOS та Android. Всі проекти проходять code review та навантажувальне тестування. У вартість вже входить підготовка документації для модерації та навчання вашої команди.

Зв'яжіться з нами — ми допоможемо вибрати архітектуру та впровадити ML у ваш застосунок під ключ. Замовте аудит наявного рішення — безкоштовно оцінимо потенціал економії серверних витрат. Отримайте консультацію експерта — напишіть нам сьогодні.