Как мы можем эффективно сегментировать длинные аудиофайлы с музыкой c по умолчанию? - PullRequest
1 голос
/ 08 апреля 2020

Я работаю над системой непрерывного распознавания речи. Мои данные содержат специальные слова, а размер данных небольшой / ограниченный. Я хочу сегментировать аудиофайлы за 2-3 секунды. Я видел pyAudioAnalysis, но он не работает, потому что на моем аудио есть инструмент, играющий на заднем плане. Как я могу сегментировать данные с такими требованиями?

1 Ответ

0 голосов
/ 08 апреля 2020

Сначала разделите инструмент с помощью чего-то вроде spleeter .

Или примените распознаватель речи, например vosk-api , который вернет вам время. Современные распознаватели речи эффективно отменяют музыку c.

...