Основы синтаксического анализа веб-страницы - PullRequest
0 голосов
/ 19 декабря 2018

каждый.

Мне нужно проанализировать веб-страницу, которая является результатом поискового запроса.Я пишу сценарий Python.Поэтому мне нужно подделать поиск кнопкой.Итак, вот мой вопрос:

Как узнать, какой скрипт запускается при нажатии кнопки?Код кнопки (как я обнаружил при просмотре страниц в Chrome):

<div class="submit button" data-ember-action="2">Search</div>

Я чувствую, что должен читать дальше.Буду признателен за идеи, в каком направлении копать.

Второй - кто должен получить вывод сценария.Но, возможно, ответом на первый вопрос будет ответ для обоих

Ответы [ 2 ]

0 голосов
/ 19 декабря 2018

Вы можете использовать Google Chrome Developer Tools / Inspector, чтобы установить точку останова, которая прослушивает любой щелчок.Установив эту точку останова, вы можете нажать кнопку в Google Chrome и получить более подробную информацию.

Вот ссылка , которая может показать вам, как попасть в Инструменты разработчика Google Chrome / Инспектор(AKA DevTools).

Открыв DevTools, нажмите на вкладку Sources в верхней части, затем разверните аккордеон Event Listener Breakpoints.Затем вы можете развернуть аккордеон Mouse и активировать точку останова прослушивателя событий click, установив флажок рядом с ней.

После этого вы можете вернуться на веб-страницу и нажать кнопку, чтобы остановитьприложение в своих треках.Оттуда вы можете использовать отладчик для пошагового выполнения кода и просмотра дополнительной информации о приложении.

0 голосов
/ 19 декабря 2018

Для этого вам нужно будет запустить JS, а не просто прочитать код страницы.

Так что используйте что-то вроде Spalsh: https://splash.readthedocs.io/en/stable/ для рендеринга JavaScript.Затем вы можете просмотреть события JS, как в Chrome.

Для реального осмотра Chrome используйте Chrome без головы: https://developers.google.com/web/updates/2017/04/headless-chrome

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...