Удаление веб-страниц после входа в систему - PullRequest
0 голосов
/ 25 мая 2020

Я хочу взять некоторые данные из (https://gps24.juwentus.pl), но для этого необходимо войти в систему. Я не знаю, как получить авторизацию, а затем взять data. Конечно у меня есть логин и пароль. Страница входа: (https://gps24.juwentus.pl/login).

После изучения я обнаружил, что имя пользователя - «логин», а имя пароля - «пройти», снизу:

<input class="loginInput" type="text" name="login" value="" placeholder="Login" id="log">
<input class="loginInput" type="password" name="pass" value="" placeholder="Hasło" id="pwd">

Я думаю, что страница входа: «https://gps24.juwentus.pl/openid/examples/consumer/try_auth.php» от:

<form method="get" action="/openid/examples/consumer/try_auth.php">
              <input type="hidden" name="action" value="verify">
              <input type="hidden" name="openid_identifier" value="https://juweid.juwentus.pl:9443/openid/">
              <input type="submit" id="submitloginOpenid" value="Zaloguj przez OpenID" style="padding-left: 30px; white-space: normal; padding-right: 30px;" class="login">
</form>

(но я также пробовал https://juweid.juwentus.pl: 9443 / openid / как действие по-разному)

Я пробовал запросов, сеанс , но все еще получаю данные «страница не авторизована» (поддерживается Как «войти in "на веб-сайт с помощью модуля запросов Python?

import requests

payload = {'login': 'good_login',
           'pass': 'good_password'}

with requests.session() as c:
    c.post('https://gps24.juwentus.pl/openid/examples/consumer/try_auth.php', data=payload)
    response = c.get('https://gps24.juwentus.pl')
    print(response.text)

Я пробовал как-то использовать 'after-logging-in- cookies ', но ничего не произошло (не хочу ставить их здесь, потому что я не знаю, безопасно ли это)

Я также пробовал что-то с http.cookiejar, urllib.request, urllib.parse с поддержкой из других сообщений, но также не мог понять, что поставить где. Пытаюсь получить помощь из других сообщений, но многие из них кажутся устаревшими. Есть какие-либо советы, в которых я делаю ошибку? Или, может быть, эта страница требует строгой защиты? * 1 042 *

РЕДАКТИРОВАТЬ: Я делаю селеновый безголовый режим, но он все равно очень медленный? Кто-нибудь знает, как сделать это быстрее?

from selenium import webdriver 
from selenium.webdriver.chrome.options import Options 
chrome_options = Options() 
chrome_options.add_argument("--headless") 
chrome_options.binary_location = r"C:\my_path\chrome.exe" 
driver = webdriver.Chrome(executable_path=os.path.abspath("chromedriver"),options=chrome_options) 
driver.get("https://gps24.juwentus.pl/")
driver.find_element_by_class_name('loginInput').send_keys('***') 
driver.find_element_by_name('pass').send_keys('***').send_keys(Keys.ENTER)
print(driver.find_element_by_name('something'))

Может быть, кто-нибудь знает, как удалить страницу с уже открытой и авторизованной? таким образом наверняка данные будут занимать много времени быстрее

...