Мне нужно иметь возможность находить индекс, предпочтительно в миллисекундах, сегмента WAV сразу после паузы (тишины). Я буду использовать этот индекс, чтобы указать, где начинается речь для нового предложения после паузы предыдущего предложения. Я могу предоставить сегмент из двух или трех секунд, который будет содержать паузу и речь с обеих сторон.
Я посмотрел на Python Wave, как открыть и сохранить файл, но я не уверен, как найти первый звук после относительной тишины и получить индекс.
Обновление:
Моя цель - проиндексировать библейские стихи, чтобы пользователь мог выбрать любой стих и услышать его прочитанным. Как только будет найден указатель на первый намек на звук, я сделаю резервную копию на несколько десятков миллисекунд для ввода.
Спасибо