Выполнение простого поиска Yahoo в Python - PullRequest
1 голос
/ 23 ноября 2011

Мне нужно написать скрипт на Python, который в какой-то момент выполняет поиск в сети Yahoo, чтобы найти и загрузить группу исходных файлов на Си. Я очень новичок в этом, и я не могу понять, как начать работу с простым веб-поиском ... Я видел много вещей о BOSS, но, насколько я понимаю, это то, что вам нужно платить за использование? Я не готов платить за это.

Я использовал Python YQL , чтобы получить некоторые результаты RSS следующим образом:

import yql
y = yql.Public()
result = y.execute('select * from rss where url="http://www.un.org/apps/news/rss/rss_top.asp"');

for row in result.rows:
   print row.get('title')

И, похоже, это работает, но я не могу понять, как просто выполнить обычный поиск в Интернете (поскольку таблица search.web, по-видимому, исчезла). Был бы очень признателен за базовый рабочий пример.

Ответы [ 2 ]

2 голосов
/ 23 ноября 2011

Возможно, вы захотите попробовать его, используя mechanize , который имитирует браузер. Если вам нужно очистить некоторые файлы в полученных файлах, используйте Beautiful Soup.

1 голос
/ 25 ноября 2011

Я не могу понять, как просто выполнить обычный поиск в Интернете (поскольку таблица search.web, по-видимому, исчезла).Очень хотелось бы получить базовый рабочий пример.

Вы можете использовать Bing в качестве поставщика поиска и использовать таблицу данных microsoft.bing.web для выполнения веб-поиска.Python, который печатает названия первых 10 результатов для cake, может выглядеть следующим образом:

import yql
y = yql.Public()
env = "http://datatables.org/alltables.env"
query = "select * from microsoft.bing.web where query=@query"

results = y.execute(query, {"query": "cake"}, env=env)

for row in results.rows:
    print row.get("Title")
...