Каково современное состояние сопоставления / поиска звука в практических терминах? В настоящее время я удаленно занимаюсь планированием веб-приложения, которое, среди прочего, будет содержать и предоставлять базу данных записанных коротких аудиоклипов (не более 3-5 секунд, имена людей). Был задан вопрос, возможно ли реализовать поиск на основе голосового ввода пользователя. Моя интуиция говорит мне, что это невыполнимая задача как с вычислительной, так и с алгоритмической точки зрения, особенно в веб-приложении (и, кроме того, это не будет основной особенностью приложения). Я понимаю, что, возможно, существует ряд академических проектов и что это будет хорошей темой для исследования, но это не что-то, что может быть реализовано в веб-приложении среднего размера в качестве дополнительной функции. В подтверждение своих заявлений я потратил полчаса на поиски, чтобы не пропустить ничего очевидного, но действительно не смог найти хороших источников.
Я знаю, что не очень ответственно задавать вопрос о SO, не тратя больше времени на самостоятельные исследования, но я заметил, что постановка вопроса о SO гораздо эффективнее, точнее и быстрее, чем просто случайный поиск в Google. прочее.