Что это за формат файла Youtube timedtext? - PullRequest
0 голосов
/ 22 октября 2019

Я записал некоторые субтитры на Youtube в формате XML. Но мне сложно понять значение тегов и алгоритм вычисления точного времени каждого слова.

Один из субтитров загружен на субтитр Youtube , который является субтитромфайл youtube video

<timedtext format="3">
<head>
<pen id="1" fc="#E5E5E5"/>
<pen id="2" fc="#CCCCCC"/>
<ws id="0"/>
<ws id="1" mh="2" ju="0" sd="3"/>
<wp id="0"/>
<wp id="1" ap="6" ah="20" av="100" rc="2" cc="40"/>
</head>
<body>
<w t="0" id="1" wp="1" ws="1"/>
<p t="5529" d="14611" w="1">
<s ac="248">darontay</s>
<s t="2520" ac="248"> outsmart</s>
<s t="4711" ac="236"> outlast</s>
<s t="6631" ac="162"> Darrin</s>
</p>
<p t="13379" d="6761" w="1" a="1"> </p>
<p t="13389" d="6751" w="1">
<s ac="251">outsmart</s>
<s t="1621" ac="237"> outlast</s>
<s t="2971" ac="231"> Darrin</s>
<s t="3971" ac="207"> Ted</s>
</p>
<p t="23750" w="1" a="1"> </p>
<p t="23760" d="2750" w="1">
<s ac="212">I</s>
<s t="30" ac="225"> left</s>
</p>
<p t="48349" w="1" a="1"> </p>
</body>
</timedtext>

Я ожидаю значения тегов в этом XML-файле (например, "t", "d", "ac") и алгоритма для точного вычисленияотметка времени каждого слова.

Большое спасибо за помощь !!

...