Как распознать эту простую капчу? - PullRequest

Ответы [ 5 ]

5 голосов
/ 14 апреля 2010

Простой ответ: NOPE

1 голос
/ 14 апреля 2010

Для очень простого: считайте изображение в градациях серого, порог, очистите и запустите его через программу ocr.

%# read the image
img = imread('http://internationalpropertiesregistry.com/Server/showFile.php?file=%2FUpload%2F02468.gif358455ebc982cb93b98a258fc4d6ee60.gif');

%# threshold
bw = img < 150; 

%# clean up
bw = bwareaopen(bw,3,4);

%# look at it - the number 8 is not so pretty, the rest looks reasonable
figure,imshow(bw)

Затем выясните, есть ли какая-нибудь программа распознавания текста, которая может помочь, например, эта

Для еще проще:

%# read the image
[img,map] = imread('http://internationalpropertiesregistry.com/Server/showFile.php?file=%2FUpload%2F02468.gif358455ebc982cb93b98a258fc4d6ee60.gif');

%# display
figure,imshow(img,map)

%# and type out the numbers. It's going to be SO much less work than writing complicated code
1 голос
/ 14 апреля 2010

Для такого простого случая вы можете просто запустить медианный фильтр и ocr.

Медианный фильтр для каждого пикселя изображения будет смотреть на область вокруг него, обычно на область 3x3 или 5x5 пикселей, определять значение медианного пикселя в этой области и устанавливать для пикселя это значение медианы. В блоке того же цвета ничего не произойдет, вся область будет того же цвета, что и рассматриваемый пиксель, поэтому среднее значение будет таким же, как текущее значение (или, по крайней мере, почти то же самое, что позволяет небольшие вариации цвета. С другой стороны, шум пикселей, то есть один пиксель с разноцветной областью вокруг него просто исчезнет, ​​поскольку медианное значение области будет цветом всех пикселей вокруг шумового пикселя.

Что касается ocr, или оптического распознавания символов, я бы просто использовал существующую программу / библиотеку, конечно, было бы возможно написать алгоритм ocr в Matlab, но это было бы гораздо большим упражнением, чем написание простого алгоритма в час. Сначала вам нужно прочитать о методах и алгоритмах ocr.

0 голосов
/ 25 января 2012

Вы можете проконсультироваться в этом посте . Мне удалось взломать более простую капчу с помощью иллюстрированного подхода.

0 голосов
/ 19 сентября 2011
  1. Очистить изображение
  2. Разделите каждый символ на отдельные изображения
  3. Сравнить каждый символ с набором ссылочных символов
  4. Лучшие совпадения - наиболее вероятный оригинальный персонаж
...