Я недавно провел исследование по этой теме. Лучший ресурс, который я нашел, - это эта статья в Википедии , которая дает ссылки на многие движки скрининга экрана.
Мне нужно было что-то, что я мог бы использовать в качестве сервера и запускать его в пакетном режиме, и из моего первоначального исследования я думаю, что Web Harvest довольно хорош в качестве решения с открытым исходным кодом, и я также был впечатлен Screen Scraper , который, кажется, очень многофункциональный, и вы можете использовать его на разных языках.
Существует также новый проект под названием Scrapy , еще не проверил его, но это Python Framework.