Как я могу получить Xpath для PageRank на Amazon? - PullRequest
0 голосов
/ 02 апреля 2019

Когда я что-то ищу в Amazon (в этом примере: «Джинсы»), я получаю обзор продуктов. Я хочу очистить / получить последовательность ранга продукта.

Чтобы сделать это более ясным, я прикрепил картинку. Я хочу вернуть цифры (1,2,3,4 и т. Д.).

Это выполнимо? Я надеялся на Xpath, но не смог найти ничего подходящего в HTML.

enter image description here

Извините, это мой первый вопрос. Надеюсь, все имеет смысл. Я использовал Python в сочетании с Scrapy для этой задачи.

EDIT.

Я думаю, что также можно посчитать "div". Любой, кто сталкивался с этим [см. Рисунок 2]. введите описание изображения здесь

1 Ответ

0 голосов
/ 02 апреля 2019

для амазонки я использую этот xpath

xpath_results= "//h5/a"

Это «основной» текст для продуктов, если вы знаете, как использовать xpath (xml tree и beautifulsoup), вы получите список. Затем повторите и вы узнаете порядок. Ваш вопрос был о xpath, так что вы получили

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...