Возможно, но не тривиально. Это предполагает, что субтитры идеально синхронизированы с диалогом (к сожалению, это, вероятно, не так). Это очень широкий вопрос, с небольшим количеством деталей, поэтому я могу предоставить только общие шаги:
Получить метки времени из субтитров. Например, используйте awk
, чтобы преобразовать его в пригодную для использования форму.
Используйте полученные метки времени для сегментирования аудио. Есть много методов, которые вы можете использовать, но они могут зависеть от (в настоящее время неизвестного) формата ваших входных потоков. Например, вы можете использовать временные метки в фильтрах atrim или aselect и присоединиться к фильтру concat . Или используйте директивы inpoint
/ outpoint
дематера concat .