Использование относительного xpath для очистки пользовательского атрибута div - PullRequest
0 голосов
/ 11 февраля 2019

У меня есть несколько сотен URL, где я пытаюсь очистить путь к изображению для изображения на странице.Каждая страница имеет один и тот же формат, но класс div уникален для каждой страницы.

Я хочу использовать импорт XML в листах Google для очистки только содержимого элемента data-path.

Я пытался и не смог использовать xpath для извлечения URL-адресов.

<div class="uniqueid active" data-path="/~/media/Images/image.jpg" data-alt="Anything"></div>

Например: //div[@class='*']/@data-path"

Пример сайта: https://www.cannondale.com/en/Australia/Bike/ProductDetail?Id=77d3b8fe-41f7-42b6-bf69-b5cf0ae55548&parentid=undefined

1 Ответ

0 голосов
/ 11 февраля 2019

Если у класса div есть шаблон "uniqueid active", то вы можете попробовать следующий XPath:

//div[contains(@class, "active")]/@data-path

В противном случае, если класс div может быть чем-либо, используйте этот запрос:

//div[@class]/@data-path

ОБНОВЛЕНИЕ:

Я пытался получить значения data-path атрибутов с помощью IMPORTXML , но безуспешно.Попытался сделать это, используя Python (requests и lxml), и это работает.Так что, вероятно, проблема в Google Sheets - некоторые ограничения или ошибки, idk.

...