библиотека видео и аудио обработки в python - PullRequest
4 голосов
/ 13 июля 2011

Какие библиотеки видео / аудио доступны в Python для распознавания определенного аудиоклипа в записи видео?
Я пытаюсь исключить начало записи из видеофайла (переход к конкретному аудиоклипу)и поэтому мне нужен был бы способ

  • отсканировать файл с самого начала
  • распознать звуковой паттерн (определенный музыкальный фрагмент всегда один и тот же)
  • запись / копирование оставшейся части видеозаписи с этого момента.

Сведения о видео

Формат: - Real Media (не имеет значения, хотя я могу преобразовать его в нечто большее)

Продолжительность: - варьируется от 18 до 24 минут

Запуск средства информации о мультимедиа для одного такого видео дает следующие подробности

Video
ID                               : 1
Format                           : RealVideo 4
Codec ID                         : RV40
Codec ID/Info                    : Based on AVC (H.264), Real Player 9
Duration                         : 19mn 18s
Bit rate                         : 195 Kbps
Width                            : 332 pixels
Height                           : 248 pixels
Display aspect ratio             : 4:3
Frame rate                       : 23.976 fps
Bits/(Pixel*Frame)               : 0.099
Stream size                      : 27.0 MiB (84%)

Audio
ID                               : 0
Format                           : Cooker
Codec ID                         : cook
Codec ID/Info                    : Based on G.722.1, Real Player 6
Duration                         : 19mn 20s
Bit rate                         : 32.0 Kbps
Channel(s)                       : 2 channels
Sampling rate                    : 44.1 KHz
Bit depth                        : 16 bits
Stream size                      : 4.43 MiB (14%)

Исходный вопрос:

Так что на днях я снова посетил анимационный сериал Dragon Ball Ball z и был раздражен видео, которое у меня было.Каждый эпизод состоит примерно из 24 минут, и у каждого из них есть полное резюме предыдущего и итоговая музыка, объединенная в общей сложности около 6-8 минут.

Я заметил, что каждое видео имеет одинаковый звук при повторениизаканчивается, и новое имя видео приходит. Я записал этот звук в отдельном файле.

Я хотел бы спросить, есть ли какой-либо способ в Python, я могу сделать следующее, кодируя: =

  1. Сканирование аудио в соответствии с записанным аудио с названием заголовка, чтобы узнать точное время фактического запуска видео.

  2. Сохраните видео, начиная с этой точки.

Я не знаю, насколько сложно это сделать, поэтому скажите, если это возможно.

Я был бы благодарен, если бы вы сказали любой библиотеке, которая предоставляет мнеинструменты для этого и дать мне несколько советов о том, как мне идти дальше.

Большое спасибо

1 Ответ

3 голосов
/ 13 июля 2011

AFAIK, распознавание речи (которое также предоставляет функциональность более низкого уровня как оценку подобия между двумя звуками) поддерживается только в Python только через библиотеки Windows или драконов, естественно говорящий API .

Как только маркер найден, вы можете использовать внешнюю библиотеку, такую ​​как this или this , чтобы вырезать видео в соответствии с требованиями.

РЕДАКТИРОВАТЬ: Aпоиск в Google также вернул pyofa обертку вокруг musicip-libofa , которая представляет собой библиотеку , позволяющую прослушивать отпечатки пальцев.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...