Учитывая известную рукопись (текст), которую, я ожидаю, пользователь прочитает (более или менее точно), каков наилучший подход для распознавания прогресса пользователя в рукописи?
В то время как я ищу конкретное решение для iOS, меня также интересует более общий ответ.
iOS предоставляет среду распознавания речи под названием Речь , которую я могу использовать для распознавания любая речь.Мой текущий подход заключается в использовании строковых результатов этой платформы, чтобы сопоставить их с рукописью.Тем не менее, мне кажется, что в этом есть некоторые издержки, и это сэкономит ресурсы и повысит точность, когда я впервые напишу распознаватель речи ожидаемыми словами, чтобы он «знал», что слушать.
Например, когда следующее слово в рукописи - «рыба», мне не нужен распознаватель речи для поиска во всем словаре английского языка слова, которое лучше всего соответствует записанному аудио - мне нужно только получить значение вероятностинасколько вероятно, что пользователь только что сказал "рыба".
Я думаю, что это очень похоже на определение ключевых слов только то, что я вижу не только несколько ключевых слов, но и словав целом рукопись.
К сожалению, я не смог найти такой API на iOS.Есть ли лучший способ добиться такого «отслеживания речи», чем описанный выше?