преобразование аудио файла в текстовый файл с использованием Java - PullRequest
5 голосов
/ 05 марта 2012

Я занимаюсь разработкой настольного приложения с использованием Java.Это приложение предназначено для школьников, чтобы преподавать английский язык, где пользователь может загрузить некоторые аудиозаписи на английском языке в любом формате, который необходимо преобразовать в текстовый файл.где они могут прочитать текст.

Я нашел некоторые API, но я не уверен в них.

http://cmusphinx.sourceforge.net/wiki/

Я видел много вопросов по stackoverflow относительно этого, но ни один не помог.если кто-то может помочь в этом, будет очень признателен

спасибо

Ответы [ 2 ]

3 голосов
/ 07 марта 2012

Существует множество технологий и услуг, доступных для распознавания речи.Для ознакомления с некоторыми из вариантов см. https://stackoverflow.com/a/6351055/90236.

Я не уверен, что результаты будут приемлемы для обучения детей английскому языку как второму, но это стоит попробовать.

3 голосов
/ 05 марта 2012

То, что вы ищете, в настоящее время является передовой технологией. Такие инструменты, как cmusphinx , могут обнаружить слова из специального ограниченного словаря (так что вы можете научить его понимать, скажем, 15 слов, и все - вы не можете научить его понимать английский).

По сути, эти инструменты пытаются найти закономерности в звуковых волнах, которые вы им подаете. Они ничего не понимают, они просто используют один и тот же алгоритм для чего-либо, а затем пытаются найти наиболее близкое соответствие. Это хорошо работает для небольших наборов слов, но с увеличением количества слов разница между сокращениями и заданиями становится все труднее (даже не начиная со слов типа «погода» или «С» и «смотри»).

То, что вы могли бы рассмотреть, - это программа «повтори за мной» Здесь вам нужно записать все слова для теста в качестве шаблонов. Затем вы можете записать слова учеников, а затем вычислить разницу. Если разница не слишком большая, слово верное. Но опять же: это простое повторение для улучшения произношения - не английский.

Существует настольное программное обеспечение, которое может много понимать английский (например, продукты из Nuance , Dragon Naturally Speaking - один из самых выдающихся). Они предлагают серверные решения, но это программное обеспечение не является бесплатным или дешевым, если у вас ограниченный бюджет.

...