Інтеграція Amazon Polly для синтезу мовлення

Проектуємо та впроваджуємо системи штучного інтелекту: від прототипу до production-ready рішення. Наша команда поєднує експертизу в машинному навчанні, дата-інжинірингу та MLOps, щоб AI працював не в лабораторії, а в реальному бізнесі.
Показано 1 з 1 послугУсі 1566 послуг
Інтеграція Amazon Polly для синтезу мовлення
Проста
~1 робочий день
Часті питання
Напрямки AI-розробки
Етапи розробки AI-рішення
Останні роботи
  • image_website-b2b-advance_0.png
    Розробка сайту компанії B2B ADVANCE
    1227
  • image_web-applications_feedme_466_0.webp
    Розробка веб-додатків для компанії FEEDME
    1163
  • image_websites_belfingroup_462_0.webp
    Розробка веб-сайту для компанії БЕЛФІНГРУП
    859
  • image_ecommerce_furnoro_435_0.webp
    Розробка інтернет магазину для компанії FURNORO
    1073
  • image_logo-advance_0.png
    Розробка логотипу компанії B2B Advance
    561
  • image_crm_enviok_479_0.webp
    Розробка веб-додатків для компанії Enviok
    829

Інтеграція Amazon Polly для синтезу мови Amazon Polly - TTS-сервіс AWS з нативною інтеграцією в екосистему Amazon: S3, Lambda, CloudFront. Підтримує Neural TTS (NTTS) голоси та класичні. Для російської: голоси Maxim (чоловічий) та Tatyana (жіночий), Neural версії недоступні для ru-RU. ### Синтез через boto3```python

import boto3

polly = boto3.client('polly', region_name='us-east-1')

def synthesize_speech(text: str) -> bytes: response = polly.synthesize_speech( Text=text, OutputFormat='mp3', # mp3 | ogg_vorbis | pcm | json VoiceId='Tatyana', # Maxim | Tatyana для ru-RU LanguageCode='ru-RU', Engine='standard', # standard | neural (не для ru-RU) SampleRate='22050', # 8000 | 16000 | 22050 TextType='text', # text | ssml ) return response['AudioStream'].read()

SSML синтез

ssml_text = """ Здравствуйте! Ваш заказ номер 12345 готов. """ response = polly.synthesize_speech( Text=ssml_text, TextType='ssml', OutputFormat='mp3', VoiceId='Tatyana', ) ### Presigned URL для прямого доступу до S3python

Для длинных текстов — async task в S3

response = polly.start_speech_synthesis_task( Text=long_text, OutputFormat='mp3', VoiceId='Tatyana', OutputS3BucketName='my-tts-bucket', OutputS3KeyPrefix='audio/' ) task_id = response['SynthesisTask']['TaskId']