бегущий селен на питоне гэе? - PullRequest
0 голосов
/ 26 декабря 2018

У меня есть приложение фляги с конечной точкой, которое использует драйвер селена и хрома. Я использую этот код для очистки веб-страниц углового веб-сайта, создания json и передачи его клиенту.

Ранее этот сайтбыл легко очищен с помощью BeautifulSoup, и я использовал для хранения json в хранилище данных вместе с текущим временем операции put. Это было сделано для того, чтобы я не просматривал веб-сайт при каждом запросе клиента, а функция проверяла его работоспособность.За 5 часов до того, как веб-сайт снова будет удален.

Но теперь я должен использовать селен, и я не могу думать, как селен может открыть браузер на сервере (как это нужно на моей локальной машине, чтобы что-то делать). Я также исследовало безголовом состоянии chrome, но в настоящее время он работает только для сервера node.js.

Единственный вариант, который я вижу сейчас, - это очистить сайт на моем локальном компьютере и загружать json в хранилище данных gae каждый раз, когда появляются новые данные.производится (точный день месяца) на веб-сайте.Есть ли способ полностью автоматизировать процесс?

1 Ответ

0 голосов
/ 27 декабря 2018

Мне удалось запустить безголовый селен на питоне GAE, но я должен был сделать это в App Engine Flex.См. Этот ответ:

Python Headless Browser для GAE

Что вы подразумеваете под "ему нужно на моей локальной машине что-либо делать"?

...