Реалізація просодичного контролю мови (швидкість, тон, гучність) Просодика - ритм, темп, інтонація, гучність мови. Точний контроль просодики дозволяє адаптувати синтез до контексту: повільніше для числових даних, голосніше для попереджень, вищий тон для питань. ### SSML-контроль просодики```xml
@dataclass class ProsodyProfile: rate: str = "medium" # x-slow | slow | medium | fast | x-fast | 80% pitch: str = "medium" # x-low | low | medium | high | x-high | +2st volume: str = "medium" # silent | x-soft | soft | medium | loud | x-loud
PROFILES = { "numbers": ProsodyProfile(rate="slow", pitch="medium"), "warning": ProsodyProfile(rate="medium", pitch="+2st", volume="loud"), "farewell": ProsodyProfile(rate="slow", pitch="-1st"), "question": ProsodyProfile(pitch="+1st"), }
def wrap_with_prosody(text: str, profile: ProsodyProfile) -> str:
return f"""### Контекстне управління через NLPpython
def detect_prosody_context(text: str) -> ProsodyProfile:
"""Автоматически определяем нужную просодику"""
if text.endswith("?"):
return PROFILES["question"]
if any(w in text.lower() for w in ["внимание", "важно", "срочно"]):
return PROFILES["warning"]
if any(char.isdigit() for char in text):
return PROFILES["numbers"]
return ProsodyProfile() # default
```### Обмеження провайдерів - Google TTS: повна підтримка <prosody> через SSML - Azure: rate в діапазоні 0.5-2.0, pitch ±50% - OpenAI TTS: тільки параметр speed (0.25-4.0), без SSML - Yandex SpeechKit: параметр speed через API, обмежений SSML Терміни. Контекстна автоматична маршрутизація – 3–4 дні.







