Как сгенерировать временные коды WebVTT из текстового файла субтитров, который содержит другой синтаксис временных кодов? - PullRequest
0 голосов
/ 27 сентября 2019

В моей компании есть задача добавить субтитры в HTML-видео для Интернета, я получу субтитры в текстовых файлах (документ Word) от клиентов.

Я хочу найти способ преобразования / созданияэтот текстовый файл в формате WebVTT, чтобы я мог использовать его в своем HTML-документе через тег.

Я уже получил документ от клиента, который отформатирован следующим образом:

[00:00] Hello, this is the first sentence

[00:02] This is the second sentence

[00:05] This is the third sentence

...

Действительноэто не очень хороший формат для WebVTT, ни для SRT, ни для других форматов, потому что клиенты не знают о правилах синтаксиса.Скорее всего так:

WEBVTT

1
00:00:00.000 --> 00:00:02.000
The first sentence

2
00:00:02.000 --> 00:00:05.000
The second sentence

3
00:00:05.000 --> 00:00:08.000
The third sentence

...

Я пытался использовать приложение "Aegisub", но, поскольку я новичок в этом инструменте, я не знаю, возможно ли сделать то, что янужно.Я уже успел автоматически сгенерировать хорошие «временные коды» при загрузке простого текстового файла с неверным синтаксисом клиента, но это было волшебно, потому что я никогда не мог его воспроизвести.что другой клиент может снова написать свои субтитры с другим синтаксисом.Итак, я должен сообщить своим клиентам, чтобы они написали свои субтитры в хорошем качестве для меня, или я должен отредактировать их вручную или есть способ преобразовать / интерпретировать текстовый формат в правильный формат WebVTT?Это было бы идеально для меня.Но если это невозможно, возможно ли по крайней мере иметь инструмент, который интерпретирует такой формат: [00:05] и преобразует его в: 00:00:05.000, тогда инструмент будет угадывать «время окончания» благодаря «времени начала»«следующего предложения?

Спасибо за вашу помощь / идеи ...

...