Я недавно работаю над использованием CMH sphinx4 для транскрипции и, в конечном счете, принудительного выравнивания, то есть выравнивания аудио с его транскриптом.
Я нашел проект под названием AutoCap , который в основном делал то, что я хотел разработать. Итак, я установил его, но он не работал. Я попытался настроить его, но все, что я получил, было неправильными метками времени.
Итак, я подумал об использовании sphinx4 и сам попробовал. Я успешно расшифровал файл wav с помощью файла Transcriber.jar в Sphinx.
Но я не мог заставить его работать на аудио с нецифровыми данными. readme состояния страниц
« люди, которые хотят транскрибировать нецифровые данные, должны изменить файл config.xml, чтобы использовать правильную грамматику, языковую модель и лингвиста, чтобы сделать это»
Итак, кто-нибудь может мне помочь с одним из этих вопросов:
- AutoCap
- Использование Sphinx4 для расшифровки нецифровых данных
- Принудительное выравнивание
Спасибо.