Синхронизация текста и аудио. Есть ли для этого библиотека НЛП / речь в текст? - PullRequest
12 голосов
/ 01 ноября 2010

Я хотел бы синхронизировать устную запись с известным текстом. Существует ли библиотека обработки речи в текст / на естественном языке, которая могла бы облегчить это? Я предполагаю, что хотел бы определить границы слов и вычислить совпадения кандидатов из словаря. Большинство вопросов, которые я нашел на SO, касаются письменного языка.

Желательно, но не обязательно:

  • Открытый исходный код
  • Совместимо с американским английским языком
  • Кроссплатформенность
  • тщательно документировано

Редактировать: Я понимаю, что это очень широкий, даже наивный вопрос, поэтому заранее спасибо за ваше руководство.

Что я нашел до сих пор:

  • OpenEars (Оболочка Sphinx / Flite для iOS)

1 Ответ

10 голосов
/ 02 ноября 2010

Принудительное выравнивание

Звучит так, как будто вы хотите принудительное выравнивание между вашим аудио и известным текстом.

Практически все системы распознавания речи исследовательского / промышленного класса смогут это делать, поскольку принудительное выравнивание является важной частью обучения системы распознавания данных, которые не имеют телефон уровнявыравнивания между аудио и транскриптом.

Выравнивание CMUSphinx

В Sphinx4-1.0 бета 5 выпуск системы распознавания речи с открытым исходным кодом CMU теперь включенадемонстрация того, как выполнить выравнивание между расшифровкой и длинной речевой записью.

...