Інтеграція Deepgram для розпізнавання мови Deepgram — один із найшвидших хмарних STT-провайдерів: затримка потокового розпізнавання 100–200 мс. Модель Nova-2 показує WER 5-8% англійською, для російської - модель beta, WER близько 12-18%. ### Моделі Deepgram | Модель | Мови | Швидкість | Сценарій |--------|-------|----------|----------| | Нова-2 | 30+ | 30x RT | Загальне призначення | Enhanced | 36+ | 50x RT | Кол-центри | | Base | 36+ | 100x RT | Вимоги до швидкості | | Whisper | 99+ | 10x RT | Мультимовні завдання | ### Інтеграція через WebSocket (streaming)
import asyncio
import websockets
import json
async def transcribe_stream():
url = "wss://api.deepgram.com/v1/listen"
headers = {"Authorization": f"Token {DEEPGRAM_API_KEY}"}
params = "?model=nova-2&language=ru&punctuate=true&diarize=true"
async with websockets.connect(url + params, extra_headers=headers) as ws:
async def send_audio():
with open("audio.wav", "rb") as f:
while chunk := f.read(4096):
await ws.send(chunk)
await ws.send(json.dumps({"type": "CloseStream"}))
async def receive_results():
async for message in ws:
result = json.loads(message)
if result.get("is_final"):
transcript = result["channel"]["alternatives"][0]["transcript"]
print(transcript)
await asyncio.gather(send_audio(), receive_results())
```### Вартість Nova-2: $0.0043/хв. Enhanced: $0.0145/хв. Безкоштовний ліміт: $200 кредитів під час реєстрації. Інтеграція: 1 день (REST), 2 дні (WebSocket streaming).







