Xpath не получает контент - PullRequest
       0

Xpath не получает контент

0 голосов
/ 09 декабря 2018

Я пытался просмотреть кучу ответов, уже связанных с этим, но я очень незнаком с xpath и немного застрял.

Я пытаюсь просто получить некоторую информацию отвеб-сайт, но я получаю «импортированный контент пуст», когда я пытаюсь использовать importxml в Excel.

Вот пример страницы, с которой я пытаюсь читать (это симулятор футбольного колледжа для запуска игр. Этот вызов - Алабама против Оклахомы с использованием команд 2019 года): http://www.ncaagamesim.com/FB_GameSimulator.asp?HomeTeam=Alabama&HomeYear=2019&AwayTeam=Oklahoma&AwayYear=2019&hs=1&hSchedule=0

Я пытаюсь получить оценки двух команд по вышеуказанной ссылке.Xpath счета первой команды предположительно /html/body/div[3]/div/div/div[2]/div/div[1]/center/div[3]/div[1]/table/tbody/tr[1]/td[2], но я получаю пустой ответ.

Я пытаюсь использовать importxml в листах Google для получения данных.

Это возвращает довольно немного, но у него нет информации, которая мне нужна.=importxml("http://www.ncaagamesim.com/FB_GameSimulator.asp?HomeTeam=Alabama&HomeYear=2019&AwayTeam=Oklahoma&AwayYear=2019&hs=1&hSchedule=0", "//div[contains(@class,gs_score)]")

Если я процитирую gs_score, он ничего не возвращает.

Буду признателен за любую помощь в этом.Спасибо!

Редактировать: Ошибка xpath с / html / body / div [3].Если я изменю это на div [2], он возвращает некоторые данные страницы, но не ту часть, которую я ищу.

Согласно найденной статье -

К сожалению, ImportXML не загружает JavaScript, поэтому вы не сможете использовать эту функцию, если сгенерировано содержимое документаJavaScript (jQuery и т. д.)

Не уверен, что это актуально ...

Редактировать 2:

Value I want to get is 14

Я заметил, что нужные мне значения находятся в html-таблице, поэтому я попытался использовать это

=IMPORTHTML("http://www.ncaagamesim.com/FB_GameSimulator.asp?HomeTeam=Alabama&HomeYear=2019&AwayTeam=Oklahoma&AwayYear=2019&hs=1&hSchedule=0", "table",1)

Я все еще не получаю никакого контента, независимо от того, какая таблицачисло, которое я вставил в эту формулу.

Если я скопирую селектор в инспекторе, мы получим:

body > div.container > div > div > div.container > div > div.col-lg-9 > center > div:nth-child(3) > div.col-sm-6.col-xs-12.gs_score.gs_borderright.rightalign > table > tbody > tr:nth-child(1) > td:nth-child(2)

, что похоже на xpath.

1 Ответ

0 голосов
/ 10 декабря 2018

Часть ответа: «gs_score» должен быть в кавычках - это строковый литерал, а не имя элемента.Как имя элемента, он ничего не выбирает, и все ничего не содержит, поэтому предикат всегда верен.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...