Существует ли простой способ очистить Google и написать текст (только текст) из первых N (скажем, 1000) .html (или любых других) документов для данного поиска?
В качестве примера представьте, что вы ищете фразу «большой плохой волк» и загружаете только текст из 1000 самых популярных хитов, т.е. фактически загружаете текст с этих 1000 веб-страниц (но только с этих страниц, а не со всего сайта). ).
Я предполагаю, что это будет использовать библиотеку urllib2? Я использую Python 3.1, если это помогает.