Реалізація автоматичного транскрибування інтерв'ю Транскрибація інтерв'ю потрібна журналістам, HR-фахівцям, дослідникам. Ключові вимоги: точна атрибуція реплік двом мовцям (інтерв'юер/респондент), збереження пауз та інтонаційних маркерів, підтримка форматування питання-відповідь. ### Швидке рішення через API```python
import assemblyai as aai
config = aai.TranscriptionConfig( language_code="ru", speaker_labels=True, # диаризация 2 говорящих speakers_expected=2, punctuate=True, format_text=True, )
transcriber = aai.Transcriber(config=config) transcript = transcriber.transcribe("interview.mp3")
Форматирование в стиле интервью
output = [] current_speaker = None for utterance in transcript.utterances: if utterance.speaker != current_speaker: label = "— " if current_speaker else "" output.append(f"\nСпикер {utterance.speaker}: {utterance.text}") current_speaker = utterance.speaker else: output.append(utterance.text)
print("\n".join(output))
### Self-hosted з форматуванням Q&Apython
async def format_as_interview(transcript: dict) -> str:
"""Форматируем транскрипт в стиль интервью"""
turns = transcript["turns"]
response = await client.chat.completions.create(
model="gpt-4o",
messages=[{
"role": "system",
"content": """Отформатируй транскрипт как журналистское интервью:
- Определи кто интервьюер, кто респондент
- Добавь метки: [Вопрос] / [Ответ] или имена если известны
- Исправь очевидные ошибки распознавания
- Сохрани оригинальные слова"""
}, {
"role": "user",
"content": "\n".join(f"Спикер {t['speaker']}: {t['text']}" for t in turns)
}]
)
return response.choices[0].message.content







