Я всего Python новичок и пытаюсь написать сценарий, который ищет черное видео и беззвучный звук в файле и возвращает только те моменты времени, когда они происходят.
У меня есть следующий код, работающий с использованием оболочки ffmpeg- python для получения значений в stdout, но я не могу найти эффективный способ синтаксического анализа stdout или stderror для возврата только экземпляры black_start , black_end , black_duration , silent_start , молчание_end , молчание_duration .
Если отложить ffmpeg для тех, кто не является экспертом, как я могу использовать re.findall или подобное, чтобы определить регулярное выражение, чтобы возвращать только указанные выше значения?
import ffmpeg
input = ffmpeg.input(source)
video = input.video.filter('blackdetect', d=0, pix_th=0.00)
audio = input.audio.filter('silencedetect', d=0.1, n='-60dB')
out = ffmpeg.output(audio, video, 'out.null', format='null')
run = out.run_async(pipe_stdout=True, pipe_stderr=True)
result = run.communicate()
print(result)
Это приводит к ffmpeg output, который содержит нужные мне результаты. Вот результат (отредактированный для краткости):
(b'', b"ffmpeg version 4.2.2 Copyright (c) 2000-2019 the FFmpeg developers
built with Apple clang version 11.0.0 (clang-1100.0.33.17)
configuration: --prefix=/usr/local/Cellar/ffmpeg/4.2.2_3 --enable-shared --enable-pthreads --...
[silencedetect @ 0x7fdd82d011c0] silence_start: 0
frame= 112 fps=0.0 q=-0.0 size=N/A time=00:00:05.00 bitrate=N/A speed=9.96x
[blackdetect @ 0x7fdd82e06580] black_start:0 black_end:5 black_duration:5
[silencedetect @ 0x7fdd82d011c0] silence_end: 5.06285 | silence_duration: 5.06285
frame= 211 fps=210 q=-0.0 size=N/A time=00:00:09.00 bitrate=N/A speed=8.97x
frame= 319 fps=212 q=-0.0 size=N/A time=00:00:13.00 bitrate=N/A speed=8.63x
frame= 427 fps=213 q=-0.0 size=N/A time=00:00:17.08 bitrate=N/A speed=8.51x
frame= 537 fps=214 q=-0.0 size=N/A time=00:00:22.00 bitrate=N/A speed=8.77x
frame= 650 fps=216 q=-0.0 size=N/A time=00:00:26.00 bitrate=N/A speed=8.63x
frame= 761 fps=217 q=-0.0 size=N/A time=00:00:31.00 bitrate=N/A speed=8.82x
frame= 874 fps=218 q=-0.0 size=N/A time=00:00:35.00 bitrate=N/A speed=8.71x
frame= 980 fps=217 q=-0.0 size=N/A time=00:00:39.20 bitrate=N/A speed=8.67x
...
frame= 5680 fps=213 q=-0.0 size=N/A time=00:03:47.20 bitrate=N/A speed=8.53x
[silencedetect @ 0x7fdd82d011c0] silence_start: 227.733
[silencedetect @ 0x7fdd82d011c0] silence_end: 229.051 | silence_duration: 1.3184
[silencedetect @ 0x7fdd82d011c0] silence_start: 229.051
[blackdetect @ 0x7fdd82e06580] black_start:229.28 black_end:230.24 black_duration:0.96
frame= 5757 fps=214 q=-0.0 Lsize=N/A time=00:03:50.28 bitrate=N/A speed=8.54x
video:3013kB audio:43178kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: unknown
[silencedetect @ 0x7fdd82d011c0] silence_end: 230.28 | silence_duration: 1.22856
\n")
Каков наиболее эффективный способ синтаксического анализа выходных данных, чтобы найти / вернуть только те значения результатов, чтобы я мог построить из них дополнительные logi c в мой код? В этом случае я бы хотел, чтобы возвращались только следующие значения:
молчание_старт: 0 silent_end: 5.06285 silent_duration: 5.06285
black_start: 0 black_end: 5 black_duration: 5
тишина_начало: 227.733 silent_end: 229.051 silent_duration: 1.3184
black_start: 229.28 black_end: 230,24 black_duration: 0,96
тишина_начало: 229.051 silent_end: 230.28 silent_duration: 1.22856
Я пробовал кучу различных параметров re.findall () с регулярным выражением, но самое близкое, что я получил, возвращает только имена значений. Например, если я добавлю это к приведенному выше:
found = re.findall('\\b' + 'silence_end' + '\\b', str(result))
print(found)
Все, что я получу, это имена:
['молчание_end', 'молчание_end', 'молчание_end']