Я работаю над скребком экрана, используя BeautifulSoup для what.cd, используя Python.Я наткнулся на этот скрипт во время работы и решил посмотреть на него, так как он, похоже, похож на тот, над которым я работаю.Однако каждый раз, когда я запускаю сценарий, я получаю сообщение о том, что мои учетные данные неверны, даже если они не таковы.
Насколько я могу судить, я получаю это сообщение, потому что когда сценарий пытается войти в системув what.cd what.cd должен возвращать cookie, содержащий информацию, которая позволяет мне запрашивать страницы позже в скрипте.Итак, сценарий не работает:
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
login_data = urllib.urlencode({'username' : username,
'password' : password})
check = opener.open('http://what.cd/login.php', login_data)
soup = BeautifulSoup(check.read())
warning = soup.find('span', 'warning')
if warning:
exit(str(warning)+'\n\nprobably means username or pw is wrong')
Я пробовал несколько методов аутентификации на сайте, включая использование CookieFileJar, сценарий, расположенный здесь , и модуль запросов.Я получил одно и то же сообщение HTML с каждым.Короче говоря, «Javascript отключен» и «Cookies отключены», а также предоставляет поле для входа в HTML.
Я действительно не хочу возиться с Mechanize, но я неНе вижу другого способа сделать это в данный момент.Если кто-нибудь может оказать какую-либо помощь, это будет с благодарностью.