Как мне перейти по xpath в «основной» раздел веб-страницы? - PullRequest
0 голосов
/ 14 июля 2020

Я пытаюсь использовать функцию import xml в таблицах Google, чтобы просмотреть данные билета в событии StubHub.

Ниже приведен xpath, предоставленный командой «inspect -> copy xpath» на страница, но это не работает. Я играл с путями около часа, и, похоже, он задерживается на "основном" идентификаторе ... Кажется, я не могу получить данные под этим заголовком.

 *[@id="main"]/div/div/div[1]/div[2]/section[1]/div[1]/ul/div/li[1]

Я опубликовал книгу со ссылкой и обновленным путем здесь . Я ищу манифест билетов (включая строку, цену и т. Д. c.), Которые будут перечислены в книге.

Как мне получить синтаксис xpath для запроса в «основной» раздел?

1 Ответ

1 голос
/ 14 июля 2020

К сожалению, вы ничего не получите с Google Sheets, так как Javascript необходим для отображения данных. Аддон IMPORTFROMWEB, поддерживающий рендеринг JS, также не работает с этим веб-сайтом. На мой взгляд, у вас есть 3 варианта достижения вашей цели:

  • Использование Selenium + Python (или любого другого языка программирования)
  • Использование Python с requests для загрузки JSON в фоновом режиме (требуются учетные данные (> Authorization заголовок)), затем отфильтруйте его с помощью json. URL-адрес JSON начинается с: https://www.stubhub.com/bfx/api/search/inventory/v2/listings?
  • Сделайте то же, что и в предыдущем решении, но с Google AppsScript непосредственно из Google Sheets.
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...