Інтеграція Нейромереж з Bitrix24
ChatGPT — це текст. Але нейромережі вміють працювати з зображеннями, голосом, класифікацією й передбаченнями. Коли маркетолог вручну малює банери, коли керівник переслуховує 40-хвилинні дзвінки замість читання резюме розмови, коли ліди розподіляються по відділам «на око» — це задачі для спеціалізованих ML-моделей, підключених до Bitrix24 через REST API.
Загальна Архітектура
Схема та ж, що при інтеграції ChatGPT, але з розширеним набором моделей:
Bitrix24 REST API → middleware-сервер → API нейромереж (OpenAI, Replicate, власні моделі)
Middleware отримує подію або виклик від Bitrix24, визначає тип задачі, вибирає модель, формує запит, отримує результат й повертає його в Bitrix24. Один middleware може працювати з десятком різних моделей — маршрутизація за типом задачі.
Транскрибація Дзвінків: Whisper
Найбільш затребуваний сценарій після текстової генерації. Менеджер поговорив з клієнтом 20 хвилин — запис зберігається в Bitrix24 як аудіофайл. Керівник не переслуховуватиме кожен дзвінок. Whisper перетворює аудіо в текст, а GPT робить із тексту структуроване резюме.
Технічна ланцюжок:
- Дзвінок завершений → подія
ONVOXIMPLANTCALLENDвідправляється на middleware. - Middleware отримує запис дзвінку через
voximplant.statistic.getй скачує аудіофайл. - Аудіо відправляється в Whisper API (
POST /v1/audio/transcriptions). Параметри:model=whisper-1,language=ru,response_format=verbose_json(з таймкодами). - Транскрипція передається в GPT із промптом: «Виділи ключові договореності, запитання клієнта, наступні кроки. Формат: JSON».
- Результат записується в коментар до дзвінку або в користувальницьке поле угоди через
crm.timeline.comment.add.
Вартість: Whisper — $0.006 за хвилину аудіо. 20-хвилинний дзвінок — $0.12. При 50 дзвінках у день — приблизно $6 за суму. Для більшості компаній це в рази дешевше часу керівника на прослуховування.
Генерація Зображень: DALL-E та Stable Diffusion
Маркетологу потрібен банер для розсилки, ілюстрація для поста в соцмережі або візуал для карточки товара. Замість брифу дизайнеру й очікування в 2 дня — запит нейромережі з інтерфейсу Bitrix24.
Реалізація:
-
Через чат-бота. Маркетолог пише боту: «Сгенеруй банер для акції -20% на зимову колекцію, стиль мінімалізм, формат 1200x628». Бот відправляє промпт в DALL-E 3 (
POST /v1/images/generations) або в Stable Diffusion через Replicate API. Отримує URL зображення, скачує, завантажує на Диск Bitrix24 черезdisk.file.uploadtofolder, відправляє превью в чат. - Через бізнес-процес. При створенні маркетингової активності в CRM автоматично генеруються варіанти візуалу на основі тексту й параметрів кампанії.
DALL-E 3 добре працює з концептуальними зображеннями й ілюстраціями. Для фотореалістичних зображень й контролю стилю використовуємо Stable Diffusion XL через Replicate — гнучкіше в налаштуванні, підтримує ControlNet та LoRA-моделі.
Класифікація та Аналіз Тональності
Текстові моделі вирішують задачи, які не зводяться до генерації:
Класифікація лідів за тематикою. Ліда містить довільний текст запиту. Модель визначає категорію: «розробка сайту», «підтримка», «інтеграція», «хостинг». На основі категорії middleware через crm.lead.update встановлює відповідний напрямок й призначає відповідальний відділ.
Аналіз тональності звернень. Листи й повідомлення з відкритих ліній проходять через модель sentiment analysis. Якщо тональність негативна — звернення отримує повищений пріоритет, повідомляється керівник. Реалізується через fine-tuned модель на базі BERT або через промпт до GPT з інструкцією класифікації за шкалою «позитивний / нейтральний / негативний».
Видобування сутностей (NER). З тексту листа або форми видобуваються структуровані дані: назва компанії, ІНН, потрібні строки, бюджет. Поля ліду заповнюються автоматично через crm.lead.update. Економить час менеджера на ручному заповненні карточки.
ML-Пайплайни через REST API
Для складних сценаріїв будуємо ланцюжки обробки:
- Вхідний лист → видобування тексту → класифікація тематики → визначення тональності → кваліфікація → маршрутизація на відповідального.
- Завершений дзвінок → транскрибація (Whisper) → резюмування (GPT) → видобування задач з розмови → автоматичне створення задач в Bitrix24.
-
Новий товар в каталозі → генерація опису (GPT) → генерація зображення (DALL-E) → публікація в CRM-каталозі через
crm.product.update.
Кожен крок пайплайну — окремий виклик API з обробкою помилок. Якщо Whisper повернув помилку — retry з експоненціальною затримкою. Якщо GPT перевищив ліміт токенів — fallback на модель меншого розміру.
Вибір Моделі за Задачею
| Задача | Модель | API | Вартість |
|---|---|---|---|
| Транскрибація дзвінків | Whisper | OpenAI | $0.006/хв |
| Резюме розмови | GPT-4o-mini | OpenAI | ~$0.01 за резюме |
| Кваліфікація ліду | GPT-4o-mini | OpenAI | ~$0.005 за ліда |
| Генерація зображень | DALL-E 3 | OpenAI | $0.04–0.08 за зображення |
| Фотореалістичні зображення | SDXL | Replicate | ~$0.01 за зображення |
| Класифікація тональності | BERT fine-tuned | Власний сервер | Вартість хостингу |
| Видобування сутностей | GPT-4o-mini / spaCy | OpenAI / свій сервер | $0.005 за запит / хостинг |
Строки Внедрення
| Масштаб | Що входить | Строк |
|---|---|---|
| Один сценарій | Транскрибація дзвінків або генерація зображень | 3–5 днів |
| Комплекс | 2–3 сценарії, класифікація + транскрибація + генерація | 1–2 тижня |
| ML-пайплайн | Повна ланцюжок обробки, кастомні моделі, моніторинг | 3–5 тижнів |
Що Внедряємо
- Middleware-сервер із маршрутизацією запитів за типом задачі й моделі
- Транскрибація дзвінків через Whisper із записом резюме в CRM
- Генерація маркетингових зображень з чату або бізнес-процесу
- Класифікація й маршрутизація лідів за тематикою й тональністю
- Видобування структурованих даних із листів та форм
- ML-пайплайни: ланцюжки обробки даних з автоматичними діями в Bitrix24
- Моніторинг вартості й якості: дашборд витрати токенів, логування результатів







