Как обработать заполнение формы в spla sh используя Lua - PullRequest
2 голосов
/ 30 апреля 2020

Я пытаюсь войти на веб-страницу (http://quotes.toscrape.com/login), используя spla sh и lua в качестве сценариев. Тем не менее, я не могу войти на сайт.

script = """

        function find_search_input(inputs)
            if #inputs == 1 then
                return inputs[1]
            else
                return inputs
            end
        end


        function find_input(forms)
            local potential = {}
            for _, form in ipairs(forms) do
                local inputs = form.node:querySelectorAll('input:not([type="hidden"])')
                if #inputs ~= 0 then
                    local input = find_search_input(inputs)
                    if input then
                        return form, input
                    end
                    potential[#potential + 1] = {input=inputs, form=form}
                end
            end
            return potential[1].form, potential[1].input
            end

        function main(splash)
            local url = splash.args.url
            assert(splash:go(url))
            assert(splash:wait(10))

            splash:set_viewport_full()

            local forms = splash:select_all('form')
            local form, input = find_input(forms)
            input['username'] = 'foobar'
            input['password'] = 'foobar'

            assert(splash:wait(0))
            assert(form:submit())

            return {
                html = splash:html()

            }


          end
        """
headers = {
            'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.162 Safari/537.36'
        }
        yield SplashRequest('http://quotes.toscrape.com/login', self.parse, endpoint='execute', args={
            'lua_source': script,
            'wait': 5
        }, splash_headers=headers, headers=headers)

И форма

<form action="/login" method="post" accept-charset="utf-8">
        <input type="hidden" name="csrf_token" value="BJNFrtYLDnpzITvSyQWOXhqCwKbscUEkGReiVjlZfogxAdumaPHM">
        <div class="row">
            <div class="form-group col-xs-3">
                <label for="username">Username</label>
                <input type="text" class="form-control" id="username" name="username">
            </div>
        </div>
        <div class="row">
            <div class="form-group col-xs-3">
                <label for="username">Password</label>
                <input type="password" class="form-control" id="password" name="password">
            </div>
        </div>
        <input type="submit" value="Login" class="btn btn-primary">

    </form>

Мое требование состоит в том, чтобы получить входные данные в форме на основе их ввода тип. Предположим, в форме входа, если мы получим тип ввода электронной почты или текста, мы установим в качестве значения нашего имени пользователя. Точно так же, если тип поля является паролем, мы будем использовать наш пароль как значение для него. И если он содержит некоторые скрытые поля, такие как csrf_tokem, тогда мы будем извлекать его значение из формы, передавая его вместе с ним.

input['type = email || type = text'] = 'our_user_name'
input['type = password'] = 'our_passwords'
input['type = hidden']= 'value_extracted from the form'

Надеюсь, это может быть простой вещью. Но я не мог понять, как это осуществить, поскольку у меня нет предыдущего опыта в этом. В любом случае, спасибо заранее за помощь в решении этой проблемы.

...