Есть ли Python lib, чтобы очистить результаты поиска (S)? - PullRequest
0 голосов
/ 02 августа 2010

Я ищу библиотеку Python, чтобы собрать результаты из поисковых систем (Google, Yahoo, Bing и т. Д.).

Я нашел только для Google -> http://github.com/kevinw/xgoogle/tree/253db7ddc8603a9dcb038ae42684cf3499a22a4b

Кто-нибудь знает один для нескольких поисковых систем?

Ответы [ 3 ]

1 голос
/ 02 августа 2010

Scrapy - это довольно крутая среда для очистки, но у вас будет код / ​​настройка для работы на нужных сайтах.

0 голосов
/ 12 октября 2015

скребок, вы можете очистить Bing, Google, Baida, Yahoo.check ссылка

0 голосов
/ 05 августа 2010

Не так уж сложно написать их. Я обычно просто использую php. Посмотрите в curl, чтобы получить страницу, а затем объект dom и dom xpath. Вы можете использовать xpath для выбора частей результата, который вы хотите.

Xpath довольно прост, если вы устанавливаете firebug и firexpath. Я сейчас работаю над проверкой позиции. Та же идея, но она возвращает позицию домена на основе ключевого слова.

...