Введение
Привет всем! В этом посте я расскажу вам о 10 лучших функциях Amazon Transcribe, которые вы должны знать, чтобы в полной мере использовать возможности этого сервиса машинного обучения. Надеюсь, вы с радостью узнали о них, так что, не теряя времени, давайте начнем!
Транскрипция в реальном времени
С помощью этой функции вы можете генерировать транскрипцию речи в режиме реального времени, вам просто нужно нажать кнопку Начать потоковую передачу и начать говорить с микрофоном, Amazon Transcribe покажет вам транскрибированный текст в прямом эфире на экране.
Эта функция полезна для создания информации о субтитрах для живого видео или онлайн-совещания.
Задание транскрипции
Это одна из основных функций Amazon Transcribe для пакетной обработки нескольких мультимедийных файлов одновременно. Задание транскрипции можно определить, выбрав несколько параметров для получения требуемого текстового вывода. Этот параметр позволяет автоматически транскрибировать сотни аудиофайлов одновременно.
Полезно для автоматической транскрибирования видеокурса, серии подкастов или любого типа аудиоконтента в массовой форме с минимальными усилиями.
Автоматическое определение языка
С помощью этой функции Amazon Transcribe может автоматически определять язык вашего входного медиафайла. Чтобы не нужно указывать язык для каждого файла вручную.
Эта функция полезна, когда требуется автоматически транскрибировать несколько мультимедийных файлов на разных языках вместе.
идентификация каналов
Если ваш аудиовходной файл содержит голоса на нескольких каналах, вы можете использовать функцию идентификации каналов Amazon Transcribe. Благодаря этой функции Amazon Transcribe автоматически идентифицирует голоса на каждом канале и создаст для них стенограммы. Вывод транскрипции будет иметь объединенный текст для всей записи, а также отдельный текст, соответствующий каждому каналу.
Очень полезно в сценарии, когда голоса клиентов и агентов службы поддержки записываются по отдельным каналам.
идентификация динамиков
Эта функция помогает идентифицировать несколько динамиков в аудиофайле. Поэтому, если вы хотите автоматически транскрибировать мультимедийный файл, в котором говорят несколько динамиков, вы можете использовать эту функцию идентификации динамиков Amazon Transcribe. Выходные данные будут иметь весь текст и отдельные тексты, соответствующие каждому динамику в медиафайле. В аудиофайле можно определить до 10 динамиков.
Эта функция может использоваться для автоматической транскрипции конференц-звонка, в котором участвовали несколько участников.
Пользовательский словарный запас
С помощью этой функции вы можете предоставить список определенных слов, которые Amazon Transcribe распознает в аудиовходе. Обычно это слова и фразы, относящиеся к конкретному домену, слова, которые Amazon Transcribe не распознает, или правильные существительные. В вашем аккаунте может быть до 100 словарных запасов, ограничение по размеру пользовательского словаря — 50 Кб. Его можно задать как в виде списка, так и в формате таблицы.
Эта функция может быть использована для того, чтобы Amazon Transcribe правильно понять и правильно разместить отраслевые термины в выходных данных транскрипции, например, одно из этих сервисов AWS с именами EC2, S3, RDS и т.д.
Фильтрация словарного запаса
Эта функция помогает автоматически маскировать или полностью удалить профанные слова в выходных данных транскрипции. Вы можете замаскировать подходящие слова тремя звездочками *** или полностью удалить их, определив фильтр словарного запаса для нежелательных слов или терминов.
Очень полезно при маскировании или удалении оскорбительных терминов при создании субтитров для семейного видео или шоу.
Автоматическое редактируемое содержимое
Эта функция автоматически отредактирует конфиденциальную личную информацию, также известную как PII, такую как имя человека, номер его банковского счета, данные кредитной карты и т. д. из результатов транскрипции и заменяет эти части текстовым PII.
Это очень полезно для выполнения требований безопасности и соответствия нормативным требованиям. Потому что с помощью этой функции вы можете защитить конфиденциальную информацию своего Клиента.
Альтернативные результаты
С помощью этой функции мы можем запросить Amazon Transcribe, чтобы дать нам альтернативные результаты транскрипции даже с несколько низкими показателями достоверности при расшифровке медиафайла, по умолчанию это дает нам только результаты транскрипции, которые имеют наивысший уровень доверия для обеспечения высокой точности. Мы можем запросить максимум 10 альтернативных результатов в выходных данных транскрипции.
При ручной проверке результатов транскрипции полезно выбрать наиболее подходящие результаты транскрипции.
Очередь заданий
Эта функция полезна при отправке большого количества заданий транскрипции в Amazon Transcribe, существует ограничение одновременного выполнения 100 заданий транскрипции, и если вы хотите выполнить больше этого числа, вы можете отправить задания транскрипции с помощью очереди заданий, это приведет к дополнительным заданиям транскрипции в очереди и будет обрабатывать их, как только слот станет доступным, по умолчанию имеется 100 слотов для заданий транскрипции, что означает, что вы можете отправить в очередь до 10 000 заданий.
Эта функция полезна при отправке большого количества заданий транскрипции для автоматической транскрипции 1000 файлов.
Заключение
Итак, речь шла о 10 лучших функциях Amazon Transcribe, которые делают этот сервис очень мощным. Если вы заинтересованы в дальнейшем их изучении, вы можете ознакомиться с одним из моих курсов на UDemy.com
Спасибо, что пройдете этот пост и предоставили мне возможность поделиться этой ценной информацией с вами.
Дайте мне знать в комментариях, какие функции из этих 10 лучших функций Amazon Transcribe вам понравились больше всего?