Используются ли данные reCAPTCHA для улучшения программного обеспечения OCR? - PullRequest
0 голосов
/ 03 апреля 2011

reCAPTCHA используется во многих местах и, несомненно, содержит огромное количество данных от «плохо выглядящего изображения» до «слова».Такого рода данные могут быть использованы для создания действительно хорошего программного обеспечения для распознавания текста.Так есть ли какое-либо программное обеспечение для распознавания, которое использует эти данные?

Ответы [ 2 ]

1 голос
/ 03 апреля 2011

сомневаюсь.Я собирался ответить, что если Google выпустит данные, связанные с recaptcha, это, вероятно, обернется против них.но на самом деле любой может обучить свою собственную нейронную сеть тому, что делает Google;проблема в том, что многие изображения, предоставляемые recaptcha, имеют настолько плохое качество, что при принятии любых выводов (или науральных сетей) из этих изображений будут получены очень высокие ложноположительные результаты

1 голос
/ 03 апреля 2011

Возможно, в качестве тренировочных данных, я сомневаюсь, что есть способ узнать.Но, по сути, именно вы должны использоваться в качестве программного обеспечения для распознавания текста (ваш ввод - если подтверждено - используется для декодирования нечитаемых словами распознавания в отсканированных книгах).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...