Как сделать webscrape глубоко вложенным XML? - PullRequest
0 голосов
/ 01 марта 2020

Я пытаюсь собрать данные XML в Google Sheets с помощью функции importxml. Ранее я пытался использовать функцию импорта html, но запрос «список» и «таблица», который вам нужно использовать, не работает.

Кажется, я не могу найти правильный способ очистки Значение "Цена (GBX)" на простой веб-странице с рыночными данными, например https://markets.ft.com/data/equities/tearsheet/summary?s=LSE: LSE

Я пытался использовать поиск по div, span и названию класса, но не получаю в любом месте.

Я также пытался скопировать XPath /html/body/div[3]/div[2]/section[1]/div/div/div[1]/div[3]/ul/li[1]/span[2], но это, похоже, не работает

Возможно ли получить данные, которые очень вложены, с помощью XML соскоба в Google Листы

1 Ответ

1 голос
/ 01 марта 2020

Попробуйте использовать

=IMPORTXML(A1,"//ul/li/span[@class='mod-ui-data-list__label'][contains(text(),'GBX')]/following-sibling::span")

Вывод:

7576.00

...