Изображения, OCR и Greasemonkey - PullRequest
       10

Изображения, OCR и Greasemonkey

1 голос
/ 02 января 2012

У меня есть веб-страница, на которой я делаю кучу классных вещей, используя greasemonkey.Я на самом деле довольно ужасен в greasemonkey/javascript, но я быстро учусь.Время от времени я получаю действительно ужасную проверку CAPTCHA, которую я хочу автоматизировать.У меня есть утилита командной строки, которая может делать это с локальными и удаленными файлами, но не с соответствующим файлом, потому что он находится за сеансом.

tim@g2sv ocr-thingy my-image.png
135189

Работает как шарм.Я ищу способ передать изображение с веб-сайта (запустить скрипт) в утилиту.Мне все равно, насколько это должно быть сложно, но на данный момент я ничего не понимаю.Я думал о том, чтобы предоставить утилиту как REST-подобный API для интерфейса greasemonkey, но я не знаю, как передать изображение в API, кроме как путем передачи URL, который не работает (как указанодо).Greasemonkey (к счастью) не позволяет вам загружать файл запуска программного обеспечения на мой ПК, поэтому самый простой вариант отсутствует.

Я открыт для всех предложений, это забавный побочный проект для меня, так чточем безумнее, тем лучше ;) Я бы предпочел вариант, который работает в фоновом режиме (не требует и не требует фокусировки, как программное обеспечение для управления мышью и клавиатурой, Java-робот).

Может быть, вы заинтересованы Я не пытаюсь нарушать какие-либо законы или что-либо еще, владелец сайта знает, что я делаю это, и ему было интересно узнать, смогу ли я это сделать!

1 Ответ

3 голосов
/ 03 января 2012

"Мне все равно, насколько это должно быть сложно, но сейчас я ничего не понимаю".

Ну, это возможно, но это "участие"процесс.Вот шаги высокого уровня:

Подход 1:

  • Забудьте о Greasemonkey;написать дополнение к FirefoxНадстройки могут взаимодействовать с файловой системой и, вероятно, могут получать данные изображения без необходимости использования Flash или Canvas .

Подход 2:

  • Используйте Greasemonkey и JS для отправки данных изображения на ваш сервер (используя GM_xmlhttpRequest () ).Это не просто, искать, как это сделать .

  • Ваш сервер может быть вашим собственным локальным компьютером, на котором работает что-то вроде XAMPP , или любым из бесплатных серверов веб-приложений.

  • Ваш сервер использует PHP (или Coldfusion, или C #, или Python и т. Д.), Чтобы запустить вашу программу OCR и делать с результатами все, что вы хотите, включая AJAXing, возвращая их к сценарию GM.1041 *

...