Question

Я использую MS Translator Speech WebSocket API для распознавания и перевода речи в реальном времени.Проблема в том, что иногда распознанный текст не имеет знаков препинания (запятые, точки и т. Д.).Транскрибированный текст выглядит хорошо в противном случае.Я также получаю MP3 с синтезированным переводом.

Это выглядит совершенно случайно, я могу отправлять одно и то же аудио несколько раз, и некоторые ответы имеют знаки препинания, а некоторые нет.Я отправляю аудио в правильном формате и почти в реальном времени, например, отправляю сэмплы 100 мс каждые ~ 100 мс.Признанный язык - испанский.

Это общая проблема или есть какая-то другая проблема?

shelll · Answer 1 · 24 сентября 2018

Переключение на API речевого просмотра устранило пропущенную пунктуацию.Пока есть только SDK, а сырой API WebSocket еще не документирован.Мне удалось подключиться и использовать WS API, больше информации в другом вопросе SO .

Chris Wendt · Answer 2 · 22 сентября 2018

Существуют разные типы ответов для частичного распознавания и окончательного распознавания.Вы получаете частичное признание, когда речь продолжает входить, и одно последнее в конце высказывания.Частичные результаты могут отсутствовать пунктуация и регистр, последний будет иметь регистр и пунктуацию.Если вы хотите игнорировать ответы без ввода пробелов и знаков препинания, вам нужно отфильтровать, чтобы увидеть только окончательные ответы.

Microsoft Translator Speech отсутствует пунктуация

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Microsoft Translator Speech отсутствует пунктуация

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы