Что я хотел бы сделать, это создать скрипт на python, который распознает, когда было сказано определенное слово, и который также может конвертировать аудио файлы в текст. Для этого я думал, что pocket-sphinx будет лучшим, потому что он также работает в автономном режиме, что является плюсом, однако я не могу заставить его работать для живой речи. Я, вероятно, пропустил целый кусок кода, но мне трудно понять документацию для него на pypi.org. Помощь будет принята с благодарностью, спасибо!