Мы следовали этому обучающему видео-распознаванию , и мы смогли успешно извлечь текст из нашего примера видео.Теперь мы хотели бы визуализировать наши результаты в оригинальном видео-образце, вроде субтитров или какого-либо другого наложения.
Могут ли службы мультимедиа Azure сделать это?Или мы должны попробовать другой SDK / другой язык?
Текст, который мы хотим наложить, структурирован в формате JSON следующим образом:
{
"start": 270000, // starts at 3 seconds
"duration": 315000, // lasts 0,5 seconds
"events": [
{
"region": {
"language": "English",
"orientation": "Up",
"lines": [
{
"text": "TEXT DETECTED",
"left": 96,
"top": 28,
"width": 128,
"height": 23,
"word": [
{
"text": "TEXT",
"left": 96,
"top": 28,
"width": 42,
"height": 23,
"confidence": 290
},
{
"text": "DETECTED",
"left": 142,
"top": 28,
"width": 82,
"height": 23,
"confidence": 270
}
]
}
]
}
}
]
}
Я хотел бы знать, можем ли мы на основе этих данных добавить наложение текста к нашемуоригинальное видео, создание выходного видео с маркировкой , чтобы визуализировать наши результаты.Сделайте что-то вроде этого:
(но локально, не размещается на YouTube)