Інтеграція Yandex SpeechKit для розпізнавання мови Yandex SpeechKit — російський STT-сервіс із оптимізацією під російську мову, російські імена та реалії. Інфраструктура в РФ – дані не залишають країну. WER російською розмовною аудіо: 10-15%, на чистій мові: 5-8%. ### Переваги для російськомовних завдань - Краща якість російською в порівнянні з Whisper в умовах телефонії - Розпізнавання імен і toponyms РФ без додаткового налаштування - ФСТЕК-сумісність при on-premise розгортанні (SpeechKit Enterprise) - Інтеграція з Yandex Cloud екосистемою: Object gRPC```python
import grpc from yandex.cloud.ai.stt.v3 import stt_pb2, stt_pb2_grpc, stt_service_pb2
channel = grpc.secure_channel('stt.api.cloud.yandex.net:443', grpc.ssl_channel_credentials()) stub = stt_pb2_grpc.RecognizerStub(channel)
recognize_options = stt_pb2.StreamingOptions( recognition_model=stt_pb2.RecognitionModelOptions( audio_format=stt_pb2.AudioFormatOptions( raw_audio=stt_pb2.RawAudio( audio_encoding=stt_pb2.RawAudio.LINEAR16_PCM, sample_rate_hertz=16000, audio_channel_count=1 ) ), language_restriction=stt_pb2.LanguageRestrictionOptions( restriction_type=stt_pb2.LanguageRestrictionOptions.WHITELIST, language_code=['ru-RU'] ), text_normalization=stt_pb2.TextNormalizationOptions( text_normalization=stt_pb2.TextNormalizationOptions.TEXT_NORMALIZATION_ENABLED, profanity_filter=False, literature_text=True ) ) )







