Реалізація автоматичної суммаризації транскрибованих зустрічей
Транскрипція зустрічі—це сирий матеріал. 60-хвилинна нарада дає 8–12 тисяч слів тексту, з яких 80%—контекст, повторення та розмовні конструкції. Завдання суммаризації: вилучити смислове ядро за секунди.
Архітектура суммаризатора
Pipeline отримує текст транскрипції (plain text або структурований JSON з позначками спікерів) та повертає структуроване резюме:
[Транскрипт]
→ [Препроцесинг: розбивка на chunks по 3000 токенів]
→ [Map: суммаризація кожного chunk]
→ [Reduce: синтез фінального резюме]
→ [Структурування: теми, рішення, наступні кроки]
Для зустрічей до 30 хвилин (< 6000 токенів)—прямий промпт без map-reduce.
Промпт та формат виходу
Оптимальний формат виходу суммаризації зустрічі:
## Коротке резюме (2–3 речення)
## Ключові теми
## Прийняті рішення
## Відкриті питання
## Учасники та їхні позиції
Моделі: GPT-4o-mini для стандартних зустрічей (вартість ~$0.002 на годину), GPT-4o для зустрічей з щільним технічним контентом. Latency: 5–15 секунд на типову зустріч.
Інтеграція з джерелами
- Zoom—Zoom AI Companion API або Download recordings API + Whisper для транскрипції
- Google Meet—Google Meet API + Speech-to-Text
- Microsoft Teams—Graph API transcripts
- Fireflies.ai / Otter.ai—webhook з готовою транскрипцією
Результат зберігається в Notion, Confluence, Jira або корпоративну вікі—через відповідні API.







