Лучший подход для сравнения распознанной речи с известным текстом - PullRequest
0 голосов
/ 26 декабря 2018

Учитывая известную рукопись (текст), которую, я ожидаю, пользователь прочитает (более или менее точно), каков наилучший подход для распознавания прогресса пользователя в рукописи?

В то время как я ищу конкретное решение для iOS, меня также интересует более общий ответ.

iOS предоставляет среду распознавания речи под названием Речь , которую я могу использовать для распознавания любая речь.Мой текущий подход заключается в использовании строковых результатов этой платформы, чтобы сопоставить их с рукописью.Тем не менее, мне кажется, что в этом есть некоторые издержки, и это сэкономит ресурсы и повысит точность, когда я впервые напишу распознаватель речи ожидаемыми словами, чтобы он «знал», что слушать.

Например, когда следующее слово в рукописи - «рыба», мне не нужен распознаватель речи для поиска во всем словаре английского языка слова, которое лучше всего соответствует записанному аудио - мне нужно только получить значение вероятностинасколько вероятно, что пользователь только что сказал "рыба".

Я думаю, что это очень похоже на определение ключевых слов только то, что я вижу не только несколько ключевых слов, но и словав целом рукопись.

К сожалению, я не смог найти такой API на iOS.Есть ли лучший способ добиться такого «отслеживания речи», чем описанный выше?

1 Ответ

0 голосов
/ 26 декабря 2018

Тем не менее, мне кажется, что это имеет некоторые накладные расходы и что это сэкономит ресурсы и повысит точность, когда я впервые напишу распознаватель речи ожидаемыми словами, чтобы он «знал», что слушать.

Возможно, так и было бы, но речевая структура не дает вам возможности сделать это, поэтому вы не можете.

...