Все ли голосовые алгоритмы работают в режиме реального времени? - PullRequest
2 голосов
/ 24 января 2009

Все ли голосовые алгоритмы современной технологии работают в режиме реального времени? Я имею в виду не человека, сидящего за компьютером с микрофоном, а ввода предварительно записанного аудиофайла.

т.е. Если у вас есть 30-минутная запись голоса, будет ли транскрибироваться всегда 30 минут?

Существуют ли разные подходы?

Ответы [ 2 ]

2 голосов
/ 24 января 2009

Ничто не мешает алгоритму работать быстрее, чем в реальном времени. Программа Naturally Speaking 10 Professional предоставляет возможность «транскрибировать из файла» для преобразования диктовки, снятой вдали от компьютера, и работает так же быстро, как компьютер, на котором она работает.

Я полагаю, что в области разведки сигналов существуют реализации пакетной обработки, но такие программы, естественно, будут недоступны для широких слоев населения.

1 голос
/ 24 января 2009

Нет причин, по которым распознавание речи должно занимать столько времени, сколько должно быть выполнено аудио. Однако, из-за требуемых вычислений, я не думаю, что вы не получите намного быстрее, чем алгоритм в реальном времени. См. этот раздел статьи в Википедии для получения более подробной информации (она, кажется, не дает никаких результатов, хотя и дает хороший обзор производительности).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...