Как Selecor выбирает любой элемент с xpath в объекте модуля запросов - PullRequest
0 голосов
/ 27 февраля 2020

Пожалуйста, сначала посмотрите на кусок кода

r = requests.get(url,headers={"User_Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36"})
    #print(r.content)
    sku = Selector(text=r.text).xpath('.//div/@data-sku').extract_first()
    print(sku)

В этом коде я пытаюсь получить некоторую информацию, четко написанную на веб-странице. Ссылка хранится в переменной url. Если я проверяю xpath элемента вручную, xpath равен (//*[@id="shop-products"]/li[1]/div[2]/p[1]). Но, как говорится в коде, xpath отличается от других, но работает буквально нормально.

Почему это происходит? Я прилагаю кусок html, а также изображение.

Example

...