Вход на сайт через Python без почтового метода - PullRequest
0 голосов
/ 25 мая 2019

Я пытался целую вечность войти на веб-страницу, чтобы очистить некоторые данные с помощью Python. Я просто не могу понять, как это сделать после проверки Chrome на сайте входа в систему, он выглядит иначе, чем любой из ответов, найденных здесь. Это сайт https://www.weatherlink.com/, и мне нужно будет зайти на сайт и затем собрать некоторые данные о скорости ветра с разных общественных станций.

Я попытался с библиотекой запросов и с несколькими различными полезными нагрузками без успеха. Со следующим кодом:

payload = {'username' : 'xx',
           'password': 'yy',
           'localTimezoneOffset': '10800000',
           'keepLogged': ''}
headers = {
  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'
}

session_requests = requests.session()

login_url = "https://www.weatherlink.com/"
result = session_requests.post(login_url, data = payload, headers = headers, verify=True)

Ожидается result.ok == True, но я получаю False с reason == "Not allowed" и status_code = 405. После входа в систему я собирал данные со станции, например, с URL https://www.weatherlink.com/bulletin/4a891aff-0761-4934-bdf9-9115397c12ea

Любая помощь очень ценится.

1 Ответ

1 голос
/ 25 мая 2019

Похоже, у вас неправильный путь для запроса POST.Попробуйте это:

payload = {
  'username': 'xxx',
  'password': 'yyy',
  'rememberMe': 'false',
  'localTimezoneOffset': '-14400000',
  'ianaTimeZone': 'America/New_York'
}

headers = {
  #you should be able to skip the user-agent string, unless your trying to bypass some kind of anti-bot protection.
}

session_requests = requests.session()

login_url = "https://www.weatherlink.com/processLogin"
result = session_requests.post(login_url, data = payload, headers = headers, verify=True)
...