Дообчання (Fine-Tuning) мовної моделі YandexGPT

Проектуємо та впроваджуємо системи штучного інтелекту: від прототипу до production-ready рішення. Наша команда поєднує експертизу в машинному навчанні, дата-інжинірингу та MLOps, щоб AI працював не в лабораторії, а в реальному бізнесі.
Показано 1 з 1Усі 1566 послуг
Дообчання (Fine-Tuning) мовної моделі YandexGPT
Складний
від 1 тижня до 3 місяців
Часті запитання

Напрямки AI-розробки

Етапи розробки AI-рішення

Останні роботи

  • image_website-b2b-advance_0.webp
    Розробка сайту компанії B2B ADVANCE
    1284
  • image_web-applications_feedme_466_0.webp
    Розробка веб-додатків для компанії FEEDME
    1196
  • image_websites_belfingroup_462_0.webp
    Розробка веб-сайту для компанії БЕЛФІНГРУП
    901
  • image_ecommerce_furnoro_435_0.webp
    Розробка інтернет магазину для компанії FURNORO
    1119
  • image_logo-advance_0.webp
    Розробка логотипу компанії B2B Advance
    586
  • image_crm_enviok_479_0.webp
    Розробка веб-додатків для компанії Enviok
    853

Дотонування мовної моделі YandexGPT

YandexGPT — мовна модель Яндекса, доступна через Yandex Cloud API (сервіс Yandex Foundation Models). Дотонування YandexGPT реалізовано в межах сервісу та дозволяє адаптувати модель для спеціальних завдань без керування GPU-інфраструктурою. Ключова перевага для російського ринку: дані зберігаються в російській хмарі, критично для компаній з вимогами 152-ФЗ та корпоративними політиками безпеки.

Доступні моделі та режими дотонування

Yandex Cloud надає дотонування на базі YandexGPT Lite та Pro через сервіс Yandex DataSphere або безпосередньо через API Foundation Models. Процес керується через консоль Yandex Cloud або CLI.

YandexGPT Lite: швидкий логічний висновок, оптимальний для класифікації, структурованої генерації, чатів підтримки.

YandexGPT Pro: вища якість, складні завдання генерування, аналіз документів, reasoning.

Формат набору даних

Дотонування YandexGPT приймає дані у форматі JSON Lines, де кожен приклад — діалог з ролями:

{
  "request": {
    "messages": [
      {
        "role": "system",
        "text": "Ти — помічник банку, що відповідає на запитання клієнтів про продукти."
      },
      {
        "role": "user",
        "text": "Яка максимальна ставка по депозиту «Накопичення плюс»?"
      }
    ]
  },
  "response": "Максимальна ставка по депозиту «Накопичення плюс» складає 16,5% річних при терміні 12 місяців та сумі від 1 000 000 рублів."
}

Рекомендований обсяг: від 100 до 50 000 прикладів. Yandex рекомендує мінімум 100 різноманітних прикладів для базової адаптації.

Запуск через Yandex Cloud CLI

# Створити набір даних
yc ai dataset create \
  --name "bank-faq-dataset" \
  --description "FAQ банківських продуктів" \
  --task-type TextToTextGeneration \
  --upload-format JsonLines \
  --upload-path ./train.jsonl

# Запустити завдання дотонування
yc ai tuning create \
  --name "yandexgpt-bank-faq" \
  --base-model-uri "ds://bt1..." \
  --train-datasets uri=<dataset_uri>,weight=1.0 \
  --arguments epochCount=4,learningRate=0.0001,warmupRatio=0.1

Через Python SDK:

import yandexcloud
from yandex.cloud.ai.tuning.v1 import tuning_service_pb2

# Використовує gRPC клієнт Yandex Cloud SDK
# Деталі в офіційній документації Yandex Foundation Models

Специфіка для російськомовних завдань

Юридичні документи: YandexGPT навчається на значно більшому обсязі російськомовних текстів, включаючи законодавство та судову практику, порівняно з більшістю західних моделей. При дотонуванні на корпусі російського законодавства початковий рівень якості вище.

Фінансова звітність за російськими стандартами: специфічні російські стандарти бухгалтерського обліку слабко представлені в західних моделях. YandexGPT — більш природний кандидат для завдань аналізу російської звітності.

Медична документація: форми Міністерства охорони здоров'я РФ, стандарти медичної допомоги, клінічні рекомендації російською мовою.

Практичний випадок: дотонування для оператора телекомунікацій

Завдання: автоматична обробка запитів у підтримку — класифікація по 28 категоріях + генерація первинної відповіді.

Набір даних: 4200 прикладів з історії квитків (реальні запити клієнтів → категорія + відповідь оператора). Дані пройшли ручну перевірку та деперсоналізацію.

Результат після 5 епох:

  • Точність класифікації: 74% → 91%
  • BLEU-4 для відповідей: 0.21 → 0.54
  • Відсоток відповідей, прийнятих без редагування оператором: 23% → 67%
  • Середній час обробки запиту: скорочення з 4.2 хв до 1.8 хв

Порівняння з альтернативами

Критерій Дотонування YandexGPT Дотонування GPT-4o Self-Hosted Llama
Зберігання даних Росія (Yandex Cloud) США (OpenAI) На місці
Сумісність 152-ФЗ Так Потребує аналізу Так
Якість для російської мови Висока Дуже висока Середня–висока
Інфраструктура Керована Керована Самокерована
Інтеграція з системами РФ Вроджена Потребує налаштування Довільна

Графік проекту

  • Підготовка та очищення набору даних: 2–4 тижні
  • Тренування та ітерації: 1–2 тижні
  • Тестування та приймання: 1 тиждень
  • Інтеграція в виробництво: 1–2 тижні
  • Усього: 5–9 тижнів