Дотонування мовної моделі YandexGPT
YandexGPT — мовна модель Яндекса, доступна через Yandex Cloud API (сервіс Yandex Foundation Models). Дотонування YandexGPT реалізовано в межах сервісу та дозволяє адаптувати модель для спеціальних завдань без керування GPU-інфраструктурою. Ключова перевага для російського ринку: дані зберігаються в російській хмарі, критично для компаній з вимогами 152-ФЗ та корпоративними політиками безпеки.
Доступні моделі та режими дотонування
Yandex Cloud надає дотонування на базі YandexGPT Lite та Pro через сервіс Yandex DataSphere або безпосередньо через API Foundation Models. Процес керується через консоль Yandex Cloud або CLI.
YandexGPT Lite: швидкий логічний висновок, оптимальний для класифікації, структурованої генерації, чатів підтримки.
YandexGPT Pro: вища якість, складні завдання генерування, аналіз документів, reasoning.
Формат набору даних
Дотонування YandexGPT приймає дані у форматі JSON Lines, де кожен приклад — діалог з ролями:
{
"request": {
"messages": [
{
"role": "system",
"text": "Ти — помічник банку, що відповідає на запитання клієнтів про продукти."
},
{
"role": "user",
"text": "Яка максимальна ставка по депозиту «Накопичення плюс»?"
}
]
},
"response": "Максимальна ставка по депозиту «Накопичення плюс» складає 16,5% річних при терміні 12 місяців та сумі від 1 000 000 рублів."
}
Рекомендований обсяг: від 100 до 50 000 прикладів. Yandex рекомендує мінімум 100 різноманітних прикладів для базової адаптації.
Запуск через Yandex Cloud CLI
# Створити набір даних
yc ai dataset create \
--name "bank-faq-dataset" \
--description "FAQ банківських продуктів" \
--task-type TextToTextGeneration \
--upload-format JsonLines \
--upload-path ./train.jsonl
# Запустити завдання дотонування
yc ai tuning create \
--name "yandexgpt-bank-faq" \
--base-model-uri "ds://bt1..." \
--train-datasets uri=<dataset_uri>,weight=1.0 \
--arguments epochCount=4,learningRate=0.0001,warmupRatio=0.1
Через Python SDK:
import yandexcloud
from yandex.cloud.ai.tuning.v1 import tuning_service_pb2
# Використовує gRPC клієнт Yandex Cloud SDK
# Деталі в офіційній документації Yandex Foundation Models
Специфіка для російськомовних завдань
Юридичні документи: YandexGPT навчається на значно більшому обсязі російськомовних текстів, включаючи законодавство та судову практику, порівняно з більшістю західних моделей. При дотонуванні на корпусі російського законодавства початковий рівень якості вище.
Фінансова звітність за російськими стандартами: специфічні російські стандарти бухгалтерського обліку слабко представлені в західних моделях. YandexGPT — більш природний кандидат для завдань аналізу російської звітності.
Медична документація: форми Міністерства охорони здоров'я РФ, стандарти медичної допомоги, клінічні рекомендації російською мовою.
Практичний випадок: дотонування для оператора телекомунікацій
Завдання: автоматична обробка запитів у підтримку — класифікація по 28 категоріях + генерація первинної відповіді.
Набір даних: 4200 прикладів з історії квитків (реальні запити клієнтів → категорія + відповідь оператора). Дані пройшли ручну перевірку та деперсоналізацію.
Результат після 5 епох:
- Точність класифікації: 74% → 91%
- BLEU-4 для відповідей: 0.21 → 0.54
- Відсоток відповідей, прийнятих без редагування оператором: 23% → 67%
- Середній час обробки запиту: скорочення з 4.2 хв до 1.8 хв
Порівняння з альтернативами
| Критерій | Дотонування YandexGPT | Дотонування GPT-4o | Self-Hosted Llama |
|---|---|---|---|
| Зберігання даних | Росія (Yandex Cloud) | США (OpenAI) | На місці |
| Сумісність 152-ФЗ | Так | Потребує аналізу | Так |
| Якість для російської мови | Висока | Дуже висока | Середня–висока |
| Інфраструктура | Керована | Керована | Самокерована |
| Інтеграція з системами РФ | Вроджена | Потребує налаштування | Довільна |
Графік проекту
- Підготовка та очищення набору даних: 2–4 тижні
- Тренування та ітерації: 1–2 тижні
- Тестування та приймання: 1 тиждень
- Інтеграція в виробництво: 1–2 тижні
- Усього: 5–9 тижнів







