Які API доступні для інтеграції Kandinsky?

Основні способи: Fusionbrain API (офіційний, безкоштовний на 100 запитів/добу), Replicate (community-моделі, платний) та HuggingFace Inference API (для прототипів). Для продакшену рекомендується Fusionbrain з власним проксі.

Як довго триває генерація зображення через Kandinsky?

Час генерації залежить від вибраного API. Fusionbrain зазвичай обробляє запит за 5–15 секунд, Replicate — 8–20 секунд. Ми реалізуємо polling з таймаутом до 90 секунд для надійності.

Чи можна використовувати Kandinsky для генерації зображень українською мовою?

Так, це ключова перевага моделі. Kandinsky розуміє українські промпти без втрати якості. Для художніх сюжетів українська мова оптимальна, а для технічних описів краще додавати англійську для точності.

Які стилі підтримує Kandinsky?

Доступні стилі: DEFAULT, ANIME, PORTRAIT, NATURE, REALISTIC. Набір може змінюватися залежно від версії моделі. Вибір стилю впливає на кольорову палітру та деталізацію.

Скільки коштує інтеграція Kandinsky у мобільний додаток?

Вартість залежить від складності: базова інтеграція з UI займає 3–4 дні, розширена з історією та стилями — 8–12 днів. Точна ціна розраховується індивідуально. Сам API безкоштовний до 100 генерацій на день, що дозволяє суттєво заощадити на початковому етапі.

Які API доступні для інтеграції Kandinsky?

Основні способи: Fusionbrain API (офіційний, безкоштовний на 100 запитів/добу), Replicate (community-моделі, платний) та HuggingFace Inference API (для прототипів). Для продакшену рекомендується Fusionbrain з власним проксі.

Як довго триває генерація зображення через Kandinsky?

Час генерації залежить від вибраного API. Fusionbrain зазвичай обробляє запит за 5–15 секунд, Replicate — 8–20 секунд. Ми реалізуємо polling з таймаутом до 90 секунд для надійності.

Чи можна використовувати Kandinsky для генерації зображень українською мовою?

Так, це ключова перевага моделі. Kandinsky розуміє українські промпти без втрати якості. Для художніх сюжетів українська мова оптимальна, а для технічних описів краще додавати англійську для точності.

Які стилі підтримує Kandinsky?

Доступні стилі: DEFAULT, ANIME, PORTRAIT, NATURE, REALISTIC. Набір може змінюватися залежно від версії моделі. Вибір стилю впливає на кольорову палітру та деталізацію.

Скільки коштує інтеграція Kandinsky у мобільний додаток?

Вартість залежить від складності: базова інтеграція з UI займає 3–4 дні, розширена з історією та стилями — 8–12 днів. Точна ціна розраховується індивідуально. Сам API безкоштовний до 100 генерацій на день, що дозволяє суттєво заощадити на початковому етапі.

Інтеграція AI-генерації зображень (Kandinsky) у мобільний додаток

TRUETECH займається розробкою, підтримкою та обслуговуванням мобільних додатків iOS, Android, PWA. Маємо великий досвід та експертизу для публікації мобільних додатків до популярних маркетів Google Play, App Store, Amazon, AppGallery та інші.

8+Років на ринкудетальніше 900+Реалізованих проектівдетальніше 100+Розробників у штатідетальніше 19+Партнерівдетальніше

Розробка та підтримка будь-яких видів мобільних додатків:

Інформаційні та розважальні мобільні програми

Новинки, ігри, довідники, онлайн-каталоги, погодні, фітнес та здоров'я, туристичні, освітні, соціальні мережі та месенджери, квіз, блоги та подкасти, форуми, агрегатори

Мобільні програми електронної комерції

Інтернет-магазини, B2B-додатки, маркетплейси, онлайн-обмінники, кешбек-сервіси, біржі, дропшиппінг-платформи, програми лояльності, доставка їжі та товарів, платіжні системи

Мобільні програми для управління бізнес-процесами

CRM-системи, ERP-системи, управління проектами, інструменти для команди продажів, облік фінансів, управління виробництвом, логістика та доставка, управління персоналом, системи моніторингу даних

Мобільні програми електронних послуг

Дошки оголошень, онлайн-школи, онлайн-кінотеатри, платформи надання електронних послуг, платформи кешбеку, відеохостинги, тематичні портали, платформи онлайн-бронювання та запису, платформи онлайн-торгівлі

Це лише деякі з типів мобільних додатків, з якими ми працюємо, і кожен із них може мати свої специфічні особливості та функціональність, а також бути адаптованим під конкретні потреби та цілі клієнта.

Послуги, які ми пропонуємо

Показано 1 з 1Усі 1734 послуг

Інтеграція AI-генерації зображень (Kandinsky) у мобільний додаток

Простий

~2-3 дні

Часті запитання

Наші компетенції:

Безкоштовна консультація

Замовте безкоштовну консультацію, якщо у вас є питання. Профільний спеціаліст вас проконсультує.

Розрахунок вартості

Якщо ви знаєте, що вам потрібно розробити, або у вас вже є готове технічне завдання.

Етапи розробки

Останні роботи

Розробка мобільного додатка для компанії FEEDME
858
Розробка мобільного додатку для компанії XOOMER
746
Розробка мобільного додатку для компанії RHL
1162
Розробка мобільного додатку для компанії ZIPPY
1034
Розробка мобільного додатку для компанії Affhome
969
Розробка мобільного додатку для компанії FLAVORS
563

Показати більше робіт

Реалізація AI-генерації зображень (Kandinsky) у мобільному додатку

Ми в команді мобільної розробки регулярно вирішуємо завдання інтеграції AI-генерації зображень. Для україномовного ринку оптимальним інструментом стала модель Kandinsky від Sber AI (версія 3.1). Її перевага — нативне розуміння українських промптів без перекладу. З нею «захід сонця над березовим лісом» працює так само, як на західних моделях англійський запит, без втрати якості. Правильна інтеграція такого сервісу займає від 3 до 12 днів, але результат — унікальна фіча для користувачів. Якщо ви замислюєтеся про додавання AI-генерації, Wikipedia: Kandinsky AI допоможе розібратися в основах, а ми покажемо, як реалізувати її технічно.

Чому варто обрати Kandinsky для мобільного додатку?

Основні причини: повна підтримка української мови, безкоштовний тариф на старті (100 запитів на добу), висока якість генерації для художніх та природних сюжетів. На відміну від багатьох західних аналогів, Kandinsky не потребує VPN і працює через офіційний Fusionbrain API. Для мобільного розробника це означає простоту інтеграції без додаткових проксі-серверів.

Доступні способи інтеграції

Порівняємо три основні підходи:

Метод	API	Безкоштовний рівень	Стабільність	Рекомендація
Fusionbrain API	REST	100 запитів/добу	Висока	Продакшен
Replicate	REST	Немає (плата за модель)	Середня	Прототипи
HuggingFace Inference API	REST	Обмежено	Низька	Експерименти

Для продакшену обираємо Fusionbrain API з власним бекендом-проксі. Це гарантує керованість та безпеку.

Як ми інтегруємо Fusionbrain API: покроковий приклад

Розглянемо процес на Kotlin (Android), хоча на Swift він практично ідентичний. Основна складність — двоетапна модель: створення завдання та polling результату.

class KandinskyService(private val apiKey: String, private val secretKey: String) {

    // Шаг 1: получить ID модели
    suspend fun getModelId(): String {
        val response = httpClient.get("https://api-key.fusionbrain.ai/key/api/v1/models") {
            header("X-Key", "Key $apiKey")
            header("X-Secret", "Secret $secretKey")
        }
        val models = response.body<List<FusionBrainModel>>()
        return models.first { it.name == "Kandinsky" }.id.toString()
    }

    // Шаг 2: создать задачу генерации
    suspend fun createTask(modelId: String, prompt: String, width: Int = 1024, height: Int = 1024): String {
        val params = JSONObject().apply {
            put("type", "GENERATE")
            put("numImages", 1)
            put("width", width)
            put("height", height)
            put("generateParams", JSONObject().apply {
                put("query", prompt)
            })
        }

        // Multipart запрос
        val requestBody = MultipartBody.Builder()
            .setType(MultipartBody.FORM)
            .addFormDataPart("model_id", modelId)
            .addFormDataPart(
                "params",
                "params.json",
                params.toString().toRequestBody("application/json".toMediaType())
            )
            .build()

        val response = OkHttpClient().newCall(
            Request.Builder()
                .url("https://api-key.fusionbrain.ai/key/api/v1/text2image/run")
                .header("X-Key", "Key $apiKey")
                .header("X-Secret", "Secret $secretKey")
                .post(requestBody)
                .build()
        ).execute()

        return JSONObject(response.body!!.string()).getString("uuid")
    }

    // Шаг 3: polling
    suspend fun pollResult(taskUuid: String): Bitmap? {
        repeat(30) {
            delay(3000)
            val response = OkHttpClient().newCall(
                Request.Builder()
                    .url("https://api-key.fusionbrain.ai/key/api/v1/text2image/status/$taskUuid")
                    .header("X-Key", "Key $apiKey")
                    .header("X-Secret", "Secret $secretKey")
                    .get()
                    .build()
            ).execute()

            val json = JSONObject(response.body!!.string())
            if (json.getString("status") == "DONE") {
                val images = json.getJSONArray("images")
                val base64 = images.getString(0)
                val bytes = Base64.decode(base64, Base64.DEFAULT)
                return BitmapFactory.decodeByteArray(bytes, 0, bytes.size)
            }
        }
        return null
    }
}

Код вище демонструє типову реалізацію. Зверніть увагу: відповідь приходить як base64-рядок, а не URL. Декодувати потрібно у фоновому потоці, щоб не блокувати UI.

Параметри генерації: блоки, стилі та негативний промпт

Kandinsky підтримує гнучке налаштування. Ось оптимальні параметри для мобільного додатку:

Параметр	Діапазон	Рекомендація
width/height	256–1024, кратне 64	768×768 або 1024×1024
style	DEFAULT, ANIME, PORTRAIT, NATURE, REALISTIC	Залежить від контенту
negativePromptDecoder	рядок	Вказувати завжди

val params = JSONObject().apply {
    put("type", "GENERATE")
    put("numImages", 1)
    put("width", 768)
    put("height", 1024)
    put("style", "PORTRAIT")
    put("generateParams", JSONObject().apply {
        put("query", "портрет молодої жінки в українському традиційному костюмі, деталізований, реалізм")
    })
    put("negativePromptDecoder", "розмитість, артефакти, деформація, текст, водяний знак")
}

Що таке negative prompt і як він покращує результат?

Негативний промпт — це опис того, чого модель повинна уникати. У прикладі вище ми вказали «розмитість, артефакти, деформація, текст, водяний знак». Це знижує ймовірність появи небажаних елементів. Для портретів та фотореалістичних сцен negative prompt обов'язковий: без нього модель може додати випадкові артефакти. Експериментуйте з формулюваннями: чим точніше опишете, що потрібно виключити, тим чистішою буде генерація.

Український промпт vs англійський: практичні рекомендації

Kandinsky розуміє українську без деградації якості. Однак для технічних описів (архітектура, механізми) англійський промпт дає точніший результат — модель навчена на змішаному корпусі, і технічні терміни краще представлені в англійській. Для художніх, пейзажних, портретних сценаріїв українська працює відмінно. Для максимальної якості пишіть промпт обома мовами (якщо UI дозволяє), Kandinsky обробить обидва.

Як уникнути типових помилок при інтеграції?

Статус FAIL від Fusionbrain без пояснень — зазвичай промпт порушує content policy або занадто короткий (менше 3 слів). Мінімальний промпт для стабільної роботи — 5–10 слів.
Декодування base64 на main thread — блокування UI. Завжди використовуйте фоновий потік: DispatchQueue.global().async (iOS) або Dispatchers.Default (Android).
Перевищення ліміту безкоштовного тарифу — моніторте кількість запитів за допомогою лічильника.

Повний чек-лист для інтеграції:

Отримано API-ключі Fusionbrain
Реалізовано polling з таймаутом (30 спроб по 3 секунди)
Обробка помилок 4xx та 5xx
Декодування base64 у фоні
Кешування результатів
UI з індикатором завантаження

Що входить у нашу роботу

При замовленні інтеграції Kandinsky у ваш мобільний додаток ми надаємо:

Backend-проксі для безпечного зберігання API-ключів.
Модуль генерації для iOS (Swift) або Android (Kotlin) з обробкою помилок.
UI-компонент для введення промпту, вибору стилю та відображення результату.
Інтеграцію з галереєю для збереження зображень.
Документацію з використання API та приклади запитів.

У нас за плечима більше десяти проєктів з інтеграції Kandinsky та більше п'яти років досвіду в mobile AI. Ми гарантуємо стабільну роботу навіть при пікових навантаженнях. Якщо ви хочете впровадити AI-генерацію у свій додаток, зв'яжіться з нами для попереднього аналізу.

Скільки часу займає інтеграція та яка її вартість?

Базова інтеграція Fusionbrain API з UI займає від 3 до 4 днів. Додавання стилів, історії генерацій, збереження в галереї та обробки помилок content policy — від 8 до 12 днів. Вартість розраховується індивідуально. Зверніть увагу: Fusionbrain API безкоштовний до 100 генерацій на день, що суттєво економить бюджет на невеликому проєкті. Для більш серйозних обсягів можна придбати платний тариф.

Отримайте консультацію з інтеграції AI-генерації у ваш додаток. Напишіть нам, і ми підберемо оптимальне рішення.

Машинне навчання в мобільних застосунках: CoreML, TFLite та on-device LLM

Ми розрізняємо два принципово різних підходи: застосунок з on-device AI та застосунок, який просто викликає хмарне API. Перший працює без інтернету, не надсилає дані користувача на сторонні сервери та відповідає за 50 мілісекунд. Другий залежить від затримки мережі та тарифного плану. Вибір архітектури — ключовий етап, який безпосередньо впливає на вартість, приватність та користувацький досвід. Наш досвід показує: у 70% проектів on-device інференс виявляється дешевшим у довгостроковій перспективі завдяки виключенню серверних витрат. Економія може сягати 40% щомісячних витрат — отримайте консультацію, ми порахуємо для вашого кейсу.

Як вибрати між CoreML та TFLite для on-device інференсу?

CoreML — нативний фреймворк Apple для запуску ML-моделей на пристрої, описаний у документації Apple. Підтримує Neural Engine (A11 Bionic та новіші), GPU та CPU як fallback. Моделі конвертуються у формат .mlmodel через coremltools з PyTorch, ONNX або TensorFlow. Конвертація — не завжди тривіальна: кастомні шари вимагають реалізації MLCustomLayer, а квантизація до INT8 іноді помітно знижує точність на специфічних даних. Ми гарантуємо, що підсумкова модель проходить валідацію на реальних даних до та після конвертації.

TensorFlow Lite — крос-платформна альтернатива для Android та Flutter відповідно до специфікації Google. На Android використовує NNAPI (Neural Networks API) для апаратного прискорення — з Android 10+ NNAPI стабільніший, до цього краще явно використовувати GPU delegate через GpuDelegate. Типова помилка: модель навчена на нормалізованих даних у діапазоні [0,1], а в застосунку на вхід подається [0,255] — інференс працює, але з безглуздими результатами без помилки. Ми включаємо модуль автоматичної валідації вхідних даних у SDK.

Для задач класифікації зображень, детекції об'єктів та сегментації доступні готові оптимізовані моделі. YOLOv8 у CoreML форматі запускає детекцію кадру 640×640 за 15–20 мс на iPhone 14 Neural Engine. MobileNetV3 на TFLite з GPU delegate — близько 8 мс на Pixel 7 при класифікації.

Параметр	CoreML	TFLite
Платформи	iOS, macOS, watchOS	Android, iOS, Linux, embedded
Апаратне прискорення	Neural Engine, GPU, CPU	NNAPI, GPU (OpenCL/OpenGL), CPU
Підтримка квантизації	FP16, INT8 (з coremltools)	FP16, INT8, dynamic range
Кастомні операції	Через MLCustomLayer (Swift)	Через делегати (Java/Kotlin)
Розмір бандла моделі	~3–5 МБ (MobileNetV2 quantized)	~2–4 МБ

Що робити, якщо потрібна генерація тексту на пристрої?

Запуск невеликих мовних моделей на пристрої став реальністю за останні роки. Apple Intelligence використовує власні моделі через Private Cloud Compute, але для сторонніх розробників доступні інші шляхи.

llama.cpp з Metal backend на iOS — робочий підхід для phi-3-mini (3.8B параметрів, 4-bit квантизація, ~2.3 ГБ). Інференс: 15–25 токенів/секунду на iPhone 15 Pro. Для інтеграції в Swift використовуємо Swift Package llama.swift або обгортку через C-інтерфейс llama.h. Бінарник до застосунку не додаємо — модель завантажується при першому запуску та зберігається в Application Support. Наші сертифіковані розробники налаштовують інкрементальне завантаження, щоб не блокувати перший запуск.

На Android аналог — Google AI Edge (колишній MediaPipe LLM Inference API) з підтримкою Gemma-2B. Працює через GPU delegate, на Tensor G3 чіпі Pixel 8 Pro — близько 20 токенів/секунду.

Порівняння LLM моделей для on-device

Модель	Параметри	Квантизація	Розмір	Швидкість (iPhone 15 Pro)
Phi-3-mini (Microsoft)	3.8B	4-bit	~2.3 ГБ	15-25 токенів/с
Gemma-2B (Google)	2B	4-bit	~1.2 ГБ	30-40 токенів/с
TinyLlama	1.1B	4-bit	~0.7 ГБ	60+ токенів/с

Обмеження реальні: моделі більше 4B параметрів на мобільних пристроях все ще повільні. Для складних задач міркування on-device LLM поступається GPT-4o за якістю. Гібридний підхід — on-device для коротких завдань та приватних даних, хмара для складних запитів — часто оптимальний. Оцінимо ваш кейс та запропонуємо баланс продуктивності та приватності — напишіть нам.

Інтеграція OpenAI API та інших хмарних моделей

Для сценаріїв, де cloud inference допустимий, інтеграція OpenAI, Anthropic або Google Gemini — це HTTP клієнт + streaming SSE. У Swift зручно через AsyncThrowingStream для стрімінгових відповідей. У Kotlin — через Flow.

Критично важливо: API-ключі ніколи не зберігаються в бандлі застосунку. Навіть обфускований ключ витягується з IPA за 10 хвилин через strings або frida. Правильна архітектура: мобільний застосунок → власний backend → OpenAI API. Backend контролює rate limiting, логує запити, захищає ключ.

Що входить у роботу (результати)

Навчена та квантизована модель під цільовий пристрій (документація за метриками)
SDK для інтеграції (Swift/Kotlin/Flutter) з прикладами виклику
Тести продуктивності на 3–5 реальних пристроях
Інструкція з оновлення моделі OTA
Підтримка при проходженні модерації App Store / Google Play (перевірка відповідності Guidelines 4.2, 5.1)
2 тижні технічної підтримки після релізу

Типовий пайплайн проекту

Аналіз завдання — вимірюємо latency, privacy, size, підтримувані пристрої.
Прототипування моделі — в Python, оцінка accuracy на цільових даних.
Конвертація та квантизація — під CoreML/TFLite з валідацією.
Інтеграція в застосунок — модель обгортається в сервісний шар (легко замінювати CoreML → TFLite → хмара).
Тестування — на реальних пристроях, вимір FPS, RAM, батареї.
Деплой — через TestFlight / Firebase App Distribution, моніторинг метрик.

Терміни: інтеграція готової CoreML/TFLite моделі — 1–2 тижні, розробка кастомної моделі з мобільною оптимізацією — від 6 тижнів, on-device LLM чат з персоналізацією — 4–8 тижнів.

Чому ми беремося за складні кейси?

10+ років досвіду в мобільній розробці, 50+ впроваджених AI/ML рішень, гарантія сумісності з актуальними версіями iOS та Android. Всі проекти проходять code review та навантажувальне тестування. У вартість вже входить підготовка документації для модерації та навчання вашої команди.

Зв'яжіться з нами — ми допоможемо вибрати архітектуру та впровадити ML у ваш застосунок під ключ. Замовте аудит наявного рішення — безкоштовно оцінимо потенціал економії серверних витрат. Отримайте консультацію експерта — напишіть нам сьогодні.