Я использовал инструмент аннотирования видео VATIC (http://www.cs.columbia.edu/~vondrick/vatic/)
впервые для маркировки объекта в видео.
Я провел следующую процедуру.
1.Установите Docker
2.Создание контейнера
sudo docker run -it -p 8111:80 -v $PWD/data:/root/vatic/data npsvisionlab/vatic-docker
3.Открытый браузер
localhost:8111/directory
4. Пометьте какой-нибудь объект в браузере
5. Выходной файл
При нажатии на кнопку Output Labels
файл output.xml
был создан автоматически.
введите описание изображения здесь
После этого я проверил выходной файл output.xml
.
Однако я не мог понять, что обозначают <x></x>
и <y></y>
в выходном файле.
Некоторые строки в output.xml
здесь.
<object><name>potB</name><moving>true</moving><action/><verified>0</verified><id>2</id><createdFrame>85</createdFrame><startFrame>85</startFrame><endFrame>2641</endFrame>
<polygon><t>85</t><pt><x>239</x><y>309</y><l>1</l></pt><pt><x>239</x><y>403</y><l>1</l></pt><pt><x>394</x><y>403</y><l>1</l></pt><pt><x>394</x><y>309</y><l>1</l></pt></polygon>
<polygon><t>86</t><pt><x>238</x><y>303</y><l>0</l></pt><pt><x>238</x><y>400</y><l>0</l></pt><pt><x>392</x><y>400</y><l>0</l></pt><pt><x>392</x><y>303</y><l>0</l></pt></polygon>
<polygon><t>87</t><pt><x>237</x><y>297</y><l>0</l></pt><pt><x>237</x><y>398</y><l>0</l></pt><pt><x>391</x><y>398</y><l>0</l></pt><pt><x>391</x><y>297</y><l>0</l></pt></polygon>
.
.
.
.
<polygon><t>2639</t><pt><x>325</x><y>119</y><l>0</l></pt><pt><x>325</x><y>243</y><l>0</l></pt><pt><x>519</x><y>243</y><l>0</l></pt><pt><x>519</x><y>119</y><l>0</l></pt></polygon>
<polygon><t>2640</t><pt><x>324</x><y>119</y><l>0</l></pt><pt><x>324</x><y>243</y><l>0</l></pt><pt><x>519</x><y>243</y><l>0</l></pt><pt><x>519</x><y>119</y><l>0</l></pt></polygon>
<polygon><t>2641</t><pt><x>324</x><y>119</y><l>1</l></pt><pt><x>324</x><y>243</y><l>1</l></pt><pt><x>520</x><y>243</y><l>1</l></pt><pt><x>520</x><y>119</y><l>1</l></pt></polygon>
</object>
В настоящее время я просто знаю, что один из <polygon></polygon>
обозначает одну информацию о граничной рамке.
И <t></t>
- номер пламени.
В <polygon></polygon>
.
есть 4 набора
<x></x>
и
<y></y>
.
Опять же, мой вопрос здесь.
Что обозначают эти <x></x>
и <y></y>
соответственно?
Где находятся x_min
y_min
x_max
y_max
?
А если знаешь,
Какое определение для x_min
y_min
x_max
y_max
?