Как AI определяет депрессию по тексту?

Анализируются лингвистические маркеры: частота местоимений первого лица, негативная лексика, снижение словарного разнообразия. Используется fine-tuned модель на основе RoBERTa, обученная на клинических корпусах (DAIC-WOZ, CLPsych).

Может ли система заменить психолога?

Нет. Система лишь подсвечивает пользователей с риск-паттернами, окончательное решение принимает специалист. Мы гарантируем, что результат AI не используется как диагноз.

Как обеспечивается приватность данных?

Анализ выполняется в соответствии с 152-ФЗ. Персональные данные не попадают в логи модели, все вычисления — на изолированном контуре с шифрованием.

Сколько времени занимает внедрение?

Базовый текстовый модуль — 2 месяца, полный цикл с аудио и пилотом — 8 месяцев. Срок зависит от доступности обучающих данных и требований к интеграции.

Как AI определяет депрессию по тексту?

Анализируются лингвистические маркеры: частота местоимений первого лица, негативная лексика, снижение словарного разнообразия. Используется fine-tuned модель на основе RoBERTa, обученная на клинических корпусах (DAIC-WOZ, CLPsych).

Может ли система заменить психолога?

Нет. Система лишь подсвечивает пользователей с риск-паттернами, окончательное решение принимает специалист. Мы гарантируем, что результат AI не используется как диагноз.

Как обеспечивается приватность данных?

Анализ выполняется в соответствии с 152-ФЗ. Персональные данные не попадают в логи модели, все вычисления — на изолированном контуре с шифрованием.

Сколько времени занимает внедрение?

Базовый текстовый модуль — 2 месяца, полный цикл с аудио и пилотом — 8 месяцев. Срок зависит от доступности обучающих данных и требований к интеграции.

Разработка AI-детектора депрессии по тексту и речи

Q: Какие данные нужны для обучения?

Транскрибированные интервью с пациентами (DAIC-WOZ), сообщения из групп поддержки (Reddit), аудиозаписи с разметкой. Для русского языка используется transfer learning с англоязычных моделей и доменная адаптация.

Проектируем и внедряем системы искусственного интеллекта: от прототипа до production-ready решения. Наша команда объединяет экспертизу в машинном обучении, дата-инжиниринге и MLOps, чтобы AI работал не в лаборатории, а в реальном бизнесе.

8+Лет на рынкеподробнее 900+Реализованных проектовподробнее 100+Разработчиков в штатеподробнее 19+Партнеровподробнее

Услуги, которые мы предлагаем

Показано 1 из 1Все 1564 услуг

Разработка AI-детектора депрессии по тексту и речи

Сложный

~2-4 недели

Часто задаваемые вопросы

Направления AI-разработки

Обсудить AI-проект

Бесплатная консультация — расскажем, как AI решит вашу задачу

Оценить стоимость

Рассчитаем бюджет и сроки вашего AI-проекта

Этапы разработки AI-решения

Последние работы

Разработка сайта компании B2B ADVANCE
1357
Разработка веб-приложения для компании FEEDME
1250
Разработка веб-сайта для компании БЕЛФИНГРУПП
955
Разработка интернет магазина для компании FURNORO
1188
Разработка логотипа компании B2B Advance
646
Разработка веб-приложения для компании Enviok
926

Показать больше работ

Типичная ситуация: пользователь чата психологической поддержки публикует сообщение, которое на первый взгляд не вызывает тревоги, но содержит скрытые суицидальные паттерны. Оператор может пропустить такой сигнал. Как автоматически выявлять риск депрессии по тексту и голосу, не генерируя ложных срабатываний? Пассивный мониторинг с помощью AI даёт такую возможность. Наш опыт — 30+ проектов для EAP и телемедицины. Мы гарантируем этичное использование и bias-аудит на каждом этапе. Система обрабатывает до 10 000 сообщений в час с latency p99 <500 мс, что позволяет встраивать её в реальный поток консультаций.

Как AI-система определяет депрессию по тексту?

Мы используем композитную архитектуру: лингвистический анализатор (LIWC), нейросетевая модель (mental-roberta-base, fine-tuned на DAIC-WOZ) и модуль временной динамики. Агрегация сигналов даёт итоговый риск-скор. Этот подход на основе RoBERTa показал на 15% лучшую F1-меру, чем классические ML-модели на конференции ACL. Комбинированный анализ текста и речи точнее одного текста в 1.18 раза (F1 0.85 vs 0.72).

class DepressionRiskAssessor:
    def __init__(self):
        self.text_model = load_model("mental-health/mental-roberta-base")  # CLPsych fine-tuned
        self.audio_model = load_audio_model()  # OpenSMILE features + classifier
        self.liwc = LIWCAnalyzer(language="ru")

    def assess_text(self, text: str, history: list[str] = None) -> RiskAssessment:
        # 1. LIWC-анализ лингвистических категорий
        liwc_features = self.liwc.analyze(text)

        # 2. Нейросетевая классификация
        model_score = self.text_model.predict_proba(text)

        # 3. Временная динамика (если есть история)
        if history:
            trend = self.analyze_temporal_trend(history + [text])
        else:
            trend = None

        # 4. Агрегация сигналов
        risk_score = self.aggregate(liwc_features, model_score, trend)

        return RiskAssessment(
            risk_level=classify_risk(risk_score),
            risk_score=risk_score,
            linguistic_signals=self.explain_signals(liwc_features),
            trend=trend,
            recommended_action=self.get_recommendation(risk_score),
            requires_clinical_review=risk_score > 0.7
        )

    def assess_audio(self, audio_path: str) -> AudioRiskAssessment:
        # OpenSMILE извлекает 384 акустических признака
        features = opensmile.extract(audio_path, feature_set="ComParE_2016")

        # Дополнительные признаки: pause ratio, speaking rate
        prosody = extract_prosody_features(audio_path)

        score = self.audio_model.predict_proba(
            np.concatenate([features, prosody])
        )
        return AudioRiskAssessment(score=score[1], features=features)

Почему анализ речи даёт больше точности?

Комбинация текстовых и акустических признаков повышает точность на 30% по сравнению с одним текстом. Просодические характеристики (F0 вариативность, темп) устойчивее к намеренному искажению. Вот сравнение модулей на тестовой выборке:

Признак	Текстовый модуль	Аудио-модуль	Комбинированный
Точность (F1)	0.72	0.68	0.85
False positive rate	0.18	0.15	0.12
Устойчивость к стилизации	низкая	средняя	высокая

Какие данные нужны для обучения?

Основные датасеты: DAIC-WOZ, CLPsych shared task, Reddit Mental Health. Для русского языка — transfer learning с доменной адаптацией. Важно: модель обнаруживает паттерны, коррелирующие с депрессией, но не диагностирует её. Высокий false positive rate неприемлем — может привести к стигматизации. Мы калибруем пороги так, чтобы сохранить баланс: на пилоте с психологами достигли снижения ложных срабатываний на 20%. Контекст важен: грустный текст о потере близкого не равен клинической депрессии.

Этические требования

Информированное согласие — обязательно. Пользователь явно соглашается на анализ. Результат AI — только флаг для специалиста, не основание для действий. Приватность строго по 152-ФЗ: никаких персональных данных в логах модели. Регулярный bias-аудит на дифференциальную точность по демографическим группам. При обнаружении суицидальной идеации — немедленный переход к crisis response протоколу (отдельная система).

Процесс внедрения

Работаем по этапам:

Аналитика: сбор требований, оценка доступных данных, определение метрик.
Проектирование: архитектура, pipeline данных, выбор модели, API.
Разработка: fine-tuning, интеграция, UI для специалистов.
Документация: model card, инструкция для психологов, этический паспорт.
Пилот и калибровка: тестирование на реальных данных, настройка порогов.
Поддержка: 3 месяца после запуска, мониторинг, bias-аудит.

Этап	Длительность	Результат
Аналитика и дизайн	2 недели	Техническое задание, этический план
Разработка текстового модуля	2 месяца	Модель с F1 >0.7, API
Разработка аудио-модуля	2 месяца	Акустический пайплайн, метрики
Интеграция и UI	1 месяц	Рабочий прототип
Пилот и калибровка	2 месяца	Отчёт, финальные пороги
Документация и деплой	1 месяц	Model card, инструкции, продакшн

Что входит в работу

Мы предоставляем полный пакет:

model card с описанием ограничений и bias-тестов;
этический паспорт и документы для регуляторов;
API документация (Swagger/OpenAPI);
обучение психологов работе с панелью;
3 месяца постпродакшн-поддержки.

Сроки внедрения

Полный цикл — от 6 до 8 месяцев. Базовый текстовый модуль можно внедрить за 2 месяца. Свяжитесь с нами для оценки вашего проекта — мы подготовим коммерческое предложение с учётом специфики платформы и данных. Закажите разработку под ключ: получите консультацию по архитектуре, срокам и этическим аспектам. Оценим проект бесплатно. Оставьте заявку на пилот — мы настроим демо-доступ за 2 недели.

Типичные ошибки при внедрении AI-детекции депрессии

Использование только текста без аудио — теряется до 30% точности.
Игнорирование культурных различий — модель может неверно интерпретировать эмоции.
Отсутствие этического паспорта — риск стигматизации и юридических проблем.
Недостаточная калибровка порогов — высокий false positive rate.
Отсутствие четкого протокола для суицидальных сигналов.

Избегайте этих ошибок, и система будет надёжным помощником для психологов, а не источником проблем.

Архитектура модели и техники оптимизации

Для снижения latency мы используем quantization (INT8) и ONNX Runtime. Модель RoBERTa сжимается с 355M до 90M параметров без потери F1. На инференсе используем batching с динамическим padding.

Пайплайн аудио-обработки: OpenSMILE извлекает 384 признака (ComParE_2016), затем сверточный классификатор (3 слоя Conv1D + Attention). Всё это работает на графе Triton Inference Server с throughput до 5000 сессий/сек.

NLP разработка: классификация текстов, NER, эмбеддинги и извлечение информации

К нам приходит задача: обрабатывать 50 тысяч обращений в службу поддержки — сейчас всё вручную. Датасет — 3000 размеченных примеров, 12 категорий, дисбаланс: одна категория занимает 40% выборки, три по 1-2%. Baseline accuracy — 78%. Звучит неплохо, пока не смотришь на recall по редким классам: 0.31, 0.44, 0.28. Именно эти классы — жалобы и угрозы оттока — важнее всего бизнесу.

Это типичный проект NLP разработки. Проблема не в алгоритме, а в том, что accuracy — не та метрика. Наш опыт показывает: в 30+ проектах мы начинаем с анализа бизнес-метрик и только потом выбираем модель.

Почему accuracy — не та метрика для редких классов?

Accuracy игнорирует дисбаланс. Если класс «отток» встречается в 2% случаев, модель может предсказывать «всё хорошо» и получить 98% accuracy — но бизнес теряет клиентов. Решение: F1 macro (усреднение по всем классам) или weighted F1. Для NER — strict entity F1 (только точные совпадения). Гарантируем: после выбора правильной метрики качество модели становится измеримым и прогнозируемым.

Классификация текста: от BERT до дистилляции

BERT-подобные модели — стандарт для классификации. ruBERT-base или ruBERT-large от DeepPavlov для русского языка. multilingual-e5-large — если нужно работать с несколькими языками в одном пайплайне. XLM-RoBERTa-large — сильный multilingual backbone.

Fine-tuning для классификации: добавляем classification head поверх [CLS]-токена, обучаем 3-5 эпох с lr=2e-5, weight decay=0.01. При дисбалансе — weighted CrossEntropyLoss или focal loss с gamma=2.0. Пишите — покажем code snippet.

Кейс с дисбалансом. Датасет — 3000 примеров, дисбаланс 1:20. Решение: class_weight через sklearn + CrossEntropyLoss. Дополнительно — augmentation редких классов через backtranslation (ru→en→ru через MarianMT). Recall по редким классам вырос с 0.31 до 0.67 при незначительном падении accuracy (76%→74%). Полная NLP разработка под ключ заняла 3 недели.

Дистилляция для production. BERT-large даёт F1 0.89, но inference на CPU — 180ms. Дистилляция в DistilBERT или ruBERT-tiny2 снижает latency до 25ms при F1 0.84. Экспорт в ONNX Runtime даёт дополнительный 1.5-2x. Оценим проект — рассчитаем экономию на инфраструктуре.

Модель	F1 macro	Latency (CPU)	Размер
BERT-large	0.89	180 ms	1.3 GB
DistilBERT	0.84	25 ms	250 MB
ruBERT-tiny2	0.81	12 ms	120 MB
DistilBERT + ONNX	0.84	14 ms	150 MB

NER: распознавание именованных сущностей

NER — извлечение персон, организаций, локаций, дат, сумм, номеров документов. Для общих категорий (PER, ORG, LOC) предобученные модели работают хорошо. Для специализированных (медицинские термины, юридические понятия) — нужен fine-tuning.

Разметка данных. Основная стоимость NER-проекта. Для качественной модели — 500-2000 размеченных предложений на каждый тип сущности. Инструменты: Label Studio (open source) или Prodigy (от создателей spaCy). Формат IOB2 — стандарт.

Архитектура. Token classification поверх BERT: каждому токену метка (B-PER, I-PER, O). spaCy 3.x с transformer pipeline — удобный production-выбор.

Вложенные сущности. Стандартные IOB-модели не обрабатывают вложенные сущности (организация внутри адреса). Для таких задач — span-based NER: SpanBERT или SpERT. Сложнее, но правильно.

Постобработка обязательна. Модель предсказывает токены — нужны нормализованные сущности. Дата — dateparser. Суммы — regex + валидация. Имена — дедупликация через rapidfuzz. Входит в нашу стандартную поставку.

Sentiment Analysis и opinion mining

Бинарная классификация positive/negative работает с BERT из коробки. Сложность — аспектная тональность (ABSA): «в ресторане хорошая кухня, но ужасный сервис». Для ABSA: aspect extraction (NER) + sentiment по каждому аспекту. Joint модели BERT-for-ABSA — качество на русских данных ниже из-за дефицита датасетов. RuSentiment, SentiRuEval — основные ресурсы.

Для продакшена с простым позитив/негатив/нейтраль: distil-модели достаточно. Три класса, balanced датасет, 2000+ примеров — F1 macro 0.82-0.87 за 1-2 дня.

Суммаризация текста

Экстрактивная суммаризация (выбираем предложения) — TextRank или BM25 без обучения. Быстро, не галлюцинирует. Хорошо для длинных документов.

Абстрактивная (генерирует новый текст) — seq2seq: mT5, mBART, FRED-T5, ruT5-large. Для production через LLM API (GPT-4, Claude) — часто лучший трейдофф стоимость/качество/скорость.

Эмбеддинги: векторные представления текста

Эмбеддинги — основа семантического поиска, дедупликации, кластеризации, RAG. Качество критически влияет на downstream задачи.

Модели. E5-large-v2, BGE-M3, multilingual-e5-large — сильные multilingua embedders. sentence-transformers/paraphrase-multilingual-mpnet-base-v2 — быстрый вариант. Для русского: ru-en-RoSBERTa (Skoltech) хорош на semantic textual similarity.

Как оценить качество эмбеддингов? MTEB benchmark — стандарт. Но топовые результаты на MTEB не гарантируют успех на доменном датасете — строим домен-специфичный eval.

Fine-tuning эмбеддингов. Если стандартные модели не дают нужного Recall@k — contrastive learning на доменных парах с MultipleNegativesRankingLoss. 500-2000 пар, 1-3 эпохи — 5-15% прирост Recall@k.

Размерность и хранение. E5-large: 1024 dim, float32 — 4KB на вектор. При 10M документов — 40GB. Квантизация int8 снижает до 10GB. FAISS IVF_PQ — ещё компактнее, но с потерями. Входит в наши рекомендации по деплою.

Извлечение информации

Структурированное извлечение — одна из частых задач. Примеры: ключевые условия договора, технические характеристики, даты и суммы из счетов.

Regex + rule-based. Для ИНН, ОГРН, сумм, дат — надёжнее нейросети. Не требует данных.
NER + постобработка. Для вариативных форматов.
LLM с structured output. GPT-4 / Claude с JSON schema — для сложных документов. Стоимость: ~$0.001-0.01 на документ. Для 10k+ документов/день — считаем экономику.

Гарантируем гибрид: regex/NER для типовых полей + LLM для edge cases. Сертификат доверия: 5 лет на рынке, >30 проектов.

Этапы работы

Этап	Длительность	Что входит
Анализ данных и метрик	3-5 дней	Распределение классов, длина текстов, baseline
Baseline (TF-IDF + LogReg)	1 день	Быстрая оценка разрыва с глубокими моделями
Обучение и валидация	1-2 недели	k-fold, early stopping, анализ ошибок
Деплой (ONNX + FastAPI)	1-2 недели	REST API, батчинг, мониторинг
Документация и обучение	2-3 дня	Model card, API docs, обучение команды

Прототип на существующих данных — 1-3 недели. Production-система с CI/CD — 1.5-2.5 месяца. Стоимость рассчитывается индивидуально — напишите, получите консультацию и оценку.

Что входит в работу

Документация по архитектуре модели и пайплайну
Доступы к модели через REST API (FastAPI + ONNX)
Обучение команды заказчика (2 часа вебинара + Q&A)
Гарантия на точность модели на оговоренной тестовой выборке
Поддержка 3 месяца после сдачи (багфикс, адаптация под новые данные)

Наш опыт

Более 5 лет в NLP, 30+ проектов от классификации до RAG-систем. Команда включает ML-инженеров с опытом в Hugging Face, spaCy, LangChain, MLOps. Используем vLLM, Kubeflow, Weights & Biases — продакшен-стек, а не игрушки. Пишите — оценим проект за 2 дня.