Использование Google Sheets для просмотра веб-страниц. Нужен правильный xpath для функции IMPORTXML - PullRequest
0 голосов
/ 05 ноября 2019

Существует страница Google, содержащая список MPN (номера деталей производителя). Попытка очистить сайт под названием wikiarms для кодов UPC, когда у меня есть MPN для предмета.

У меня есть правильная формула для этого на другом сайте.

=IMPORTXML("http://gun.deals/search/apachesolr_search/"&B1,"//dd/a[../../dt[contains(text(),'UPC')]]|//dd/span[../../dt[contains(text(),'UPC')]]")

Попытка выяснить, какой правильный xpath завершит эту формулу. В некоторых видео, которые я смотрел, сказано, чтобы открыть страницу в Chrome и использовать инспектор, чтобы выбрать и скопировать xpath для выполнения функции importxml. Я попробовал это без удачи.

Пример посещения https://www.wikiarms.com/guns?q=20071

В таблице есть кнопка «Доступно в 6 магазинах», нажмите на которую, чтобы открыть список. UPC должен быть указан после MPN.

Если я скопирую xpath в Chrome, это будет результат

/html/body/div[1]/div/div/div[2]/div/div/div[2]/div[2]/table/tbody/tr[2]/td[5]

=IMPORTXML("https://www.wikiarms.com/guns?q="&B2,"xpath here")

Что я должен добавить в конце этой формулы, чтобы получить код UPC? Я буду использовать эту формулу для ввода кода UPC для примерно 1000 наименований.

Спасибо за помощь.

1 Ответ

1 голос
/ 06 ноября 2019

Используя пример ссылки, попробуйте

=IMPORTXML("https://www.wikiarms.com/guns?q=20071","//td[@class='upc']/a/@title")

и посмотрите, работает ли он для вас.

...