У меня проблема с данными изображения (гистограмма упорядоченного градиента) для большого количества отсканированных изображений. Каждое изображение может содержать цифры и рукописные маркировки. Я хочу иметь возможность взять каждое изображение и вернуть, какие цифры / маркировки присутствуют. Поскольку существует фиксированное количество возможных номеров / маркировок (всего 18), я отношусь к каждой из них как к метке и планирую решить эту проблему как проблему классификации по нескольким меткам. Однако дополнительное осложнение заключается в том, что порядок меток имеет значение. Мне нужно уметь отличать guish изображение 43 от изображения 34.
Таким образом, каждая метка принимает целочисленное значение: 0, если не на изображении, 1, если в первая позиция, 2, если во второй позиции, et c. Для некоторого дополнительного контекста, 95% выборки содержат только 1 метку, а максимальное количество меток на одном изображении равно 3.
Есть ли у вас какие-либо мысли о наилучшем подходе к решению этой проблемы? Я думал о том, чтобы попытаться сформулировать это как проблему ранжирования, но мне еще не повезло. Спасибо!
Образец изображения 1
Образец изображения 2
Образец изображения 3