Я понимаю, что это может быть неправильный форум, чтобы спросить.
Требование:
- Обработка видео со звуком
- Перевести аудио в текст
- Для каждого слова регистрируется время от и до
Идея, заключающаяся в том, что предложение или фраза могут быть построены путем обработки видео со звуком и превращены в новое видео, состоящее изсегменты, выбранные из вывода.
Есть ли что-то доступное сегодня, чтобы достичь этого?Если нет, то с чего начать.