Вы можете использовать VietSpider XML с
http://sourceforge.net/projects/binhgiang/files/
Скачать VietSpider3_16_XML_Windows.zip или VietSpider3_16_XML_Linux.zip
VietSpider Web Data Extractor: Программное обеспечение сканирует данные с веб-сайтов ((Data Scraper)), форматирует их в стандарт XML (Text, CDATA) и затем сохраняет их в реляционной базе данных. Продукт поддерживает различные RDBM, такие как Oracle, MySQL, SQL Server, H2, HSQL, Apache Derby, Postgres… VietSpider Crawler поддерживает сессию (вход в систему, запрос по форме ввода), мультизагрузку, обработку JavaScript, прокси (и мульти-прокси автоматическое сканирование прокси с сайта)…