Question

Мы добились больших успехов, используя сервис Watson s2t для захвата коротких записей.Но новый проект требует от нас транскрибирования длинных, плотных аудиопотоков, с небольшими перерывами между высказываниями.Это, кажется, приводит к нетривиальной задержке, которая продолжает накапливаться.Например, в ранних тестах типичный 2-минутный аудиопоток, который был разобран в 4-6 транскриптов, отставал более чем на 30 секунд (для коротких высказываний он длится сотни мс и никогда не отстает).Период молчания в аудио, кажется, позволяет сервису восстановить данные.

Вопрос: есть ли способ смягчить это поведение?Возможно, сократить разрыв между стенограммами (кажется жестко запрограммированным до 500 мс на стороне сервера)?

Наш прототип написан на Java и использует WebSockets.

-rg

Watson speech2text отстает для плотных стенограмм

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Watson speech2text отстает для плотных стенограмм

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы