Реалізація розпізнавання спеціалізованої лексики (медичної, юридичної, технічної)

Проектуємо та впроваджуємо системи штучного інтелекту: від прототипу до production-ready рішення. Наша команда поєднує експертизу в машинному навчанні, дата-інжинірингу та MLOps, щоб AI працював не в лабораторії, а в реальному бізнесі.
Показано 1 з 1Усі 1566 послуг
Реалізація розпізнавання спеціалізованої лексики (медичної, юридичної, технічної)
Середній
від 1 тижня до 3 місяців
Часті запитання

Напрямки AI-розробки

Етапи розробки AI-рішення

Останні роботи

  • image_website-b2b-advance_0.webp
    Розробка сайту компанії B2B ADVANCE
    1284
  • image_web-applications_feedme_466_0.webp
    Розробка веб-додатків для компанії FEEDME
    1196
  • image_websites_belfingroup_462_0.webp
    Розробка веб-сайту для компанії БЕЛФІНГРУП
    901
  • image_ecommerce_furnoro_435_0.webp
    Розробка інтернет магазину для компанії FURNORO
    1119
  • image_logo-advance_0.webp
    Розробка логотипу компанії B2B Advance
    586
  • image_crm_enviok_479_0.webp
    Розробка веб-додатків для компанії Enviok
    853

Реалізація розпізнавання спеціалізованої лексики (медичної, юридичної, технічної) Стандартні STT-моделі навчені на загальному корпусі. Специфічні терміни - "діоксид кремнію", "апеляційне визначення", "мікроконтролер STM32F407" - часто розпізнаються некоректно, що робить транскрипт непридатним без постредагування. ### Методи адаптації 1. Custom Vocabulary / Boosting - найшвидший підхід, не вимагає перенавчання:```python

Google STT — адаптивные фразы

from google.cloud import speech

speech_context = speech.SpeechContext( phrases=[ "мерцательная аритмия", "фибрилляция желудочков", "атриовентрикулярная блокада", "ЭКГ", "QRS-комплекс" ], boost=15.0 # от 1 до 20 ) config = speech.RecognitionConfig( speech_contexts=[speech_context], language_code="ru-RU" ) **2. Post-correction через словник** - знаходимо фонетично схожі слова та замінюємо:python from fuzzywuzzy import fuzz

DOMAIN_TERMS = { "дексаметозон": "дексаметазон", "миокарда инфаркт": "инфаркт миокарда", "гипотиреоз": "гипотиреоз", }

def correct_medical_terms(text: str, threshold: int = 80) -> str: words = text.split() for i, word in enumerate(words): for wrong, correct in DOMAIN_TERMS.items(): if fuzz.ratio(word.lower(), wrong) >= threshold: words[i] = correct return " ".join(words)

Терміни: словниковий підхід - 2-3 дні. Fine-tuning - 2-4 тижні з урахуванням збору даних.