Я собираю обзоры Amazon, и они дают уникальный идентификатор каждому обзору, который я хотел бы очистить.Однако идентификатор никогда не отображается в виде текста, а просто существует в следующей форме:
<div id="R2XLFP626GRWEM" data-hook="review" class="a-section review aok-relative">
Я хочу, чтобы "R2XLFP626GRWEM" возвращался.
При использовании
response.xpath('.//div[@data-hook="review"]').extract()
Я получаю все содержимое тега div, что довольно много, учитывая, что в него встроен весь обзор.
Продукт, который я собираю
Содержание мне нужно: