Реалізація автоматичного транскрибування інтерв'ю

Проектуємо та впроваджуємо системи штучного інтелекту: від прототипу до production-ready рішення. Наша команда поєднує експертизу в машинному навчанні, дата-інжинірингу та MLOps, щоб AI працював не в лабораторії, а в реальному бізнесі.
Показано 1 з 1Усі 1566 послуг
Реалізація автоматичного транскрибування інтерв'ю
Простий
від 1 дня до 3 днів
Часті запитання

Напрямки AI-розробки

Етапи розробки AI-рішення

Останні роботи

  • image_website-b2b-advance_0.webp
    Розробка сайту компанії B2B ADVANCE
    1284
  • image_web-applications_feedme_466_0.webp
    Розробка веб-додатків для компанії FEEDME
    1196
  • image_websites_belfingroup_462_0.webp
    Розробка веб-сайту для компанії БЕЛФІНГРУП
    901
  • image_ecommerce_furnoro_435_0.webp
    Розробка інтернет магазину для компанії FURNORO
    1119
  • image_logo-advance_0.webp
    Розробка логотипу компанії B2B Advance
    586
  • image_crm_enviok_479_0.webp
    Розробка веб-додатків для компанії Enviok
    853

Реалізація автоматичного транскрибування інтерв'ю Транскрибація інтерв'ю потрібна журналістам, HR-фахівцям, дослідникам. Ключові вимоги: точна атрибуція реплік двом мовцям (інтерв'юер/респондент), збереження пауз та інтонаційних маркерів, підтримка форматування питання-відповідь. ### Швидке рішення через API```python

import assemblyai as aai

config = aai.TranscriptionConfig( language_code="ru", speaker_labels=True, # диаризация 2 говорящих speakers_expected=2, punctuate=True, format_text=True, )

transcriber = aai.Transcriber(config=config) transcript = transcriber.transcribe("interview.mp3")

Форматирование в стиле интервью

output = [] current_speaker = None for utterance in transcript.utterances: if utterance.speaker != current_speaker: label = "— " if current_speaker else "" output.append(f"\nСпикер {utterance.speaker}: {utterance.text}") current_speaker = utterance.speaker else: output.append(utterance.text)

print("\n".join(output)) ### Self-hosted з форматуванням Q&Apython async def format_as_interview(transcript: dict) -> str: """Форматируем транскрипт в стиль интервью""" turns = transcript["turns"]

response = await client.chat.completions.create(
    model="gpt-4o",
    messages=[{
        "role": "system",
        "content": """Отформатируй транскрипт как журналистское интервью:
        - Определи кто интервьюер, кто респондент
        - Добавь метки: [Вопрос] / [Ответ] или имена если известны
        - Исправь очевидные ошибки распознавания
        - Сохрани оригинальные слова"""
    }, {
        "role": "user",
        "content": "\n".join(f"Спикер {t['speaker']}: {t['text']}" for t in turns)
    }]
)
return response.choices[0].message.content