как найти аутентификацию, используемую на сайте - PullRequest
0 голосов
/ 02 марта 2012

Я читал о BeautifulSoup, http-заголовках, аутентификации, файлах cookie и о механизме.

Я пытаюсь очистить свои любимые сайты с Python. Как девиантное искусство, для которого я нашел скребок. Сейчас я пытаюсь войти, но примеры кода проверки подлинности, которые я пытаюсь сделать, не работают.

Итак, вопрос, как мне узнать, какой тип аутентификации использует сайт, чтобы я знал, что пытаюсь войти в систему правильным способом? Включая такие вещи, как действительные пользовательские агенты, когда они пытаются заблокировать ботов.

Имейте мое невежество, поскольку я новичок в HTTP, Python и чистке.

1 Ответ

0 голосов
/ 03 марта 2012

Маловероятно, что какой-либо из сайтов, которые вас интересуют, использует базовую аутентификацию. Вам понадобится библиотека, например механизатор, которая управляет файлами cookie, и вам нужно будет предоставить информацию для входа на страницу входа в систему сайта.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...