Інтеграція AWS Transcribe для розпізнавання мови Amazon Transcribe - керований ASR-сервіс AWS з нативною інтеграцією в екосистему Amazon: S3, Lambda, EventBridge, Comprehend. Оптимальний для компаній, які вже використовують AWS-інфраструктуру. ### Можливості з коробки - Custom Vocabulary та Custom Language Model для доменної адаптації - Call Analytics - спеціалізована модель для кол-центрів з автоматичним визначенням тональності та ключових моментів - Medical Transcribe - HIPAA-сумісна версія для медицини - Автоматична ідентифікація PII та її маскування ###```python
import boto3 import time
transcribe = boto3.client('transcribe', region_name='us-east-1')
transcribe.start_transcription_job( TranscriptionJobName='meeting-2024-001', Media={'MediaFileUri': 's3://my-bucket/audio/meeting.mp3'}, MediaFormat='mp3', LanguageCode='ru-RU', Settings={ 'ShowSpeakerLabels': True, 'MaxSpeakerLabels': 4, 'EnableAutomaticPunctuation': True, 'VocabularyName': 'corporate-vocabulary' } )
Polling статуса
while True: status = transcribe.get_transcription_job( TranscriptionJobName='meeting-2024-001' ) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break time.sleep(30)







