Microsoft Translator Speech отсутствует пунктуация - PullRequest
0 голосов
/ 20 сентября 2018

Я использую MS Translator Speech WebSocket API для распознавания и перевода речи в реальном времени.Проблема в том, что иногда распознанный текст не имеет знаков препинания (запятые, точки и т. Д.).Транскрибированный текст выглядит хорошо в противном случае.Я также получаю MP3 с синтезированным переводом.

Это выглядит совершенно случайно, я могу отправлять одно и то же аудио несколько раз, и некоторые ответы имеют знаки препинания, а некоторые нет.Я отправляю аудио в правильном формате и почти в реальном времени, например, отправляю сэмплы 100 мс каждые ~ 100 мс.Признанный язык - испанский.

Это общая проблема или есть какая-то другая проблема?

Ответы [ 2 ]

0 голосов
/ 24 сентября 2018

Переключение на API речевого просмотра устранило пропущенную пунктуацию.Пока есть только SDK, а сырой API WebSocket еще не документирован.Мне удалось подключиться и использовать WS API, больше информации в другом вопросе SO .

0 голосов
/ 22 сентября 2018

Существуют разные типы ответов для частичного распознавания и окончательного распознавания.Вы получаете частичное признание, когда речь продолжает входить, и одно последнее в конце высказывания.Частичные результаты могут отсутствовать пунктуация и регистр, последний будет иметь регистр и пунктуацию.Если вы хотите игнорировать ответы без ввода пробелов и знаков препинания, вам нужно отфильтровать, чтобы увидеть только окончательные ответы.

...