Інтеграція Deepgram для розпізнавання мови

Проектуємо та впроваджуємо системи штучного інтелекту: від прототипу до production-ready рішення. Наша команда поєднує експертизу в машинному навчанні, дата-інжинірингу та MLOps, щоб AI працював не в лабораторії, а в реальному бізнесі.
Показано 1 з 1Усі 1566 послуг
Інтеграція Deepgram для розпізнавання мови
Простий
від 1 дня до 3 днів
Часті запитання

Напрямки AI-розробки

Етапи розробки AI-рішення

Останні роботи

  • image_website-b2b-advance_0.webp
    Розробка сайту компанії B2B ADVANCE
    1284
  • image_web-applications_feedme_466_0.webp
    Розробка веб-додатків для компанії FEEDME
    1196
  • image_websites_belfingroup_462_0.webp
    Розробка веб-сайту для компанії БЕЛФІНГРУП
    901
  • image_ecommerce_furnoro_435_0.webp
    Розробка інтернет магазину для компанії FURNORO
    1119
  • image_logo-advance_0.webp
    Розробка логотипу компанії B2B Advance
    586
  • image_crm_enviok_479_0.webp
    Розробка веб-додатків для компанії Enviok
    853

Інтеграція Deepgram для розпізнавання мови Deepgram — один із найшвидших хмарних STT-провайдерів: затримка потокового розпізнавання 100–200 мс. Модель Nova-2 показує WER 5-8% англійською, для російської - модель beta, WER близько 12-18%. ### Моделі Deepgram | Модель | Мови | Швидкість | Сценарій |--------|-------|----------|----------| | Нова-2 | 30+ | 30x RT | Загальне призначення | Enhanced | 36+ | 50x RT | Кол-центри | | Base | 36+ | 100x RT | Вимоги до швидкості | | Whisper | 99+ | 10x RT | Мультимовні завдання | ### Інтеграція через WebSocket (streaming)

import asyncio
import websockets
import json

async def transcribe_stream():
    url = "wss://api.deepgram.com/v1/listen"
    headers = {"Authorization": f"Token {DEEPGRAM_API_KEY}"}
    params = "?model=nova-2&language=ru&punctuate=true&diarize=true"

    async with websockets.connect(url + params, extra_headers=headers) as ws:
        async def send_audio():
            with open("audio.wav", "rb") as f:
                while chunk := f.read(4096):
                    await ws.send(chunk)
            await ws.send(json.dumps({"type": "CloseStream"}))

        async def receive_results():
            async for message in ws:
                result = json.loads(message)
                if result.get("is_final"):
                    transcript = result["channel"]["alternatives"][0]["transcript"]
                    print(transcript)

        await asyncio.gather(send_audio(), receive_results())
```### Вартість Nova-2: $0.0043/хв. Enhanced: $0.0145/хв. Безкоштовний ліміт: $200 кредитів під час реєстрації. Інтеграція: 1 день (REST), 2 дні (WebSocket streaming).