Сканирование и хранение в Python в MySQL - PullRequest
1 голос
/ 25 октября 2010

Мне нужен хороший веб-сканер, написанный на Python для хранения полной страницы в базе данных mysql.Небольшая система, которую я сейчас экспериментирую, использует PHP Sphider для сканирования и сохранения в базе данных.Мне нужно что-то, что работает почти точно как sphider, но написано на Python.Так что просто храните базу данных в таблице, откуда другие скрипты берут контент и выполняют остальную часть работы, которая мне нужна.Sphider работает медленно и хочет заменить его.

Итак, я смотрю на scrapy и некоторые другие проекты, но что-то не отвечает моим потребностям, это моя последняя попытка, прежде чем я начну кодировать себя, так что если кто-тознаете, что может решить эту проблему, пожалуйста, скажите мне.

1 Ответ

0 голосов
/ 15 октября 2012

берегитесь!

Этот ответ предназначен для начинающих, это НЕ 1005 * оптимальный или самый умный.

Но для вас я настоятельно рекомендую scrapy . Попробуйте учебник. И помните , чтобы использовать расширение Firefox + Firebug, чтобы вы могли перемещаться и изучать внутренние пути , xpaths и html расположение ваших данных для заднего парсера.

Проверьте похожие ответы " Переход от Ruby к сканерам Python " и " Python прочитайте мой почтовый ящик Outlook Outlook и проанализируйте сообщения "

Экономьте свое время и используйте Firefox с расширениями FireBug (включите inspect)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...