Python: генерирует статус говорящего (0 для не говорящего, 1 для говорящего) из файла WAV - PullRequest
0 голосов
/ 06 декабря 2018

У меня есть данные записи конференции, в которых 4 человека сидят вместе и разговаривают.Для каждого человека у меня есть отворот записи в формате WAV.Теперь я хочу сгенерировать речевой статус на основе этих 4 файлов WAV в python, например, если человек 1 говорит, а остальные 3 не говорят на таймфрейме 0, то сгенерированный вектор должен быть: 1000 Я искал в Интернете и нашел тамэто пакет под названием wave , но я не уверен, например, как его выполнить, хотя человек 2 не говорит, но в записи его отворота все равно будет слышен шумовой сигнал.

Есть какие-нибудь предложения для меня?Большое спасибо!

...