Question

Я работаю над системой непрерывного распознавания речи. Мои данные содержат специальные слова, а размер данных небольшой / ограниченный. Я хочу сегментировать аудиофайлы за 2-3 секунды. Я видел pyAudioAnalysis, но он не работает, потому что на моем аудио есть инструмент, играющий на заднем плане. Как я могу сегментировать данные с такими требованиями?

Nikolay Shmyrev · Answer 1 · 08 апреля 2020

Сначала разделите инструмент с помощью чего-то вроде spleeter .

Или примените распознаватель речи, например vosk-api , который вернет вам время. Современные распознаватели речи эффективно отменяют музыку c.

Как мы можем эффективно сегментировать длинные аудиофайлы с музыкой c по умолчанию?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как мы можем эффективно сегментировать длинные аудиофайлы с музыкой c по умолчанию?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы