В Python мне нужно хранить один элемент исходного HTML-страницы в виде строки. Как я могу это сделать? - PullRequest
1 голос
/ 27 февраля 2010

До сих пор мне удалось написать некоторый код, который должен напечатать исходный код страницы. Проблема в том, что это не так. Я попробовал это с другим веб-сайтом, и он распечатал это хорошо, поэтому я использовал wget на странице "http://www.whitepages.com/carrier_lookup?carrier=other&number_0=2165138899&response=1", который должен загрузить страницу для меня. Это выдало" ОШИБКА 403: Запрещено. ", поэтому я не совсем уверен, как получить доступ к HTML сейчас.

Вторая часть проблемы заключается в том, что когда мне удается загрузить html и сохранить его в виде строки, мне нужно сохранить в качестве другой строки носителя, найденного при поиске. Это доступно в виде строки под строкой [div class = "carrier_result"] в исходном коде. В предыдущем предложении я заменил <и> скобками, потому что sourceforge не позволил бы мне опубликовать html.

Пока код у меня есть: http://pastebin.com/u4HUv3Rj

Спасибо всем, кто помогает мне в этом.

1 Ответ

1 голос
/ 27 февраля 2010

Объяснение того, что означает результат 403 по HTTP и как с ним обращаться, см. здесь .

Я понятия не имею, что может означать «мне нужно сохранить в качестве другой строки носитель, который был найден при поиске» - я даже не могу разобрать его как английское предложение, и при этом я не знаю, что «строка под линия "означает либо. Пожалуйста, перефразируйте (если английский не является вашим родным языком, я могу попробовать итальянский, французский, испанский, немецкий или латиноамериканский - с меньшей вероятностью и без гарантии успеха, но он не может быть хуже, чем ваш нынешний фразировки; -)

.
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...