Watson speech2text отстает для плотных стенограмм - PullRequest
0 голосов
/ 07 февраля 2019

Мы добились больших успехов, используя сервис Watson s2t для захвата коротких записей.Но новый проект требует от нас транскрибирования длинных, плотных аудиопотоков, с небольшими перерывами между высказываниями.Это, кажется, приводит к нетривиальной задержке, которая продолжает накапливаться.Например, в ранних тестах типичный 2-минутный аудиопоток, который был разобран в 4-6 транскриптов, отставал более чем на 30 секунд (для коротких высказываний он длится сотни мс и никогда не отстает).Период молчания в аудио, кажется, позволяет сервису восстановить данные.

Вопрос: есть ли способ смягчить это поведение?Возможно, сократить разрыв между стенограммами (кажется жестко запрограммированным до 500 мс на стороне сервера)?

Наш прототип написан на Java и использует WebSockets.

-rg

...