Какой алгоритм классификации наиболее подходит для классификации изображений юридических документов? - PullRequest
2 голосов
/ 22 сентября 2011

У меня есть набор документов, таких как (идентификаторы, водительские права, паспорта и т. Д.) В нескольких странах, поэтому мне нужно классифицировать их каждый в своем классе, а затем я могу классифицировать любые новые документы - не в моем наборев своем классе.

Документы могут быть повернуты или сдвинуты, или и то, и другое.Цвет документов двух документов одного и того же класса может быть не совсем одинаковым.

Какой лучший алгоритм для этого?

Ответы [ 3 ]

2 голосов
/ 22 сентября 2011

Проблема не в том, какой алгоритм классификации выбрать, а в том, чтобы понять все соответствующие скрытые измерения в вашей проблеме классификации. Как только вы поймете все аспекты измерения, вы можете использовать любой из алгоритмов классификации, чтобы достичь того, что вы хотите.

1 голос
/ 22 сентября 2011

Как уже упоминали другие, это не настоящая проблема классификации. Кроме того, поскольку у вас есть элементы, которые могут быть повернуты, перекошены и т. Д., Вам действительно нужно выполнить какой-либо анализ объектов / анализ объектов на изображениях.

Я бы рекомендовал изучить перцептивное хеширование или Ускоренные надежные функции (SURF) (более поздние, если вы имеете дело с огромным количеством вращения / перекоса). А именно, я бы разбил изображения на области, которые не являются идентифицирующими (например, вы бы исключили области, содержащие информацию о пользователе или их фотографию), концентрируясь на областях, которые имеют большое количество совпадающих характерных точек.

Используйте области, которые одинаковы для всех экземпляров определенного класса идентификаторов, чтобы ваши оценки совпадений были выше, а затем соберите совокупности всех сравниваемых разделов, чтобы выполнить вашу классификацию.

0 голосов
/ 22 сентября 2011

Существуют десятки, если не сотни алгоритмов классификации - в основном вы ищете кластеризацию.

http://en.wikipedia.org/wiki/Cluster_analysis

Чтобы сделать это, вам придется проанализировать документ и свести его к нескольким ключевым цифрам. Это не должно быть идеальным для кластеризации для работы.

Так что, возможно, было бы неплохо провести некоторую нормализацию (повернуть все документы так, чтобы текст располагался горизонтально), но, возможно, нет. Например, если ключевой классификационный номер был основан на общем цвете - это было бы то же самое для любого поворота.

...