Выбор значений HTML-страницы с помощью Beautiful Soup - PullRequest
0 голосов
/ 10 июня 2018

Я пытался выяснить это в течение нескольких часов, и у меня все получается. Каждый метод, который я пытаюсь, не представляет правильное значение.

import requests
from bs4 import BeautifulSoup

r = requests.get('https://www.off---white.com/en/GB/products/omia065s188000160100')
soup = BeautifulSoup(r.content, 'html.parser')

Я хочу извлечь следующие значенияс веб-страницы (https://www.off --- white.com/en/GB/products/omia065s188000160100)

Name = LOW 3.0 SNEAKER
Price = £ 415
img_url = https://cdn.off---white.com/images/156365/large_OMIA065S188000160100_4.jpg?1498202305

Как мне извлечь эти 3 значения с помощью Beautiful Soup?

1 Ответ

0 голосов
/ 10 июня 2018
import requests
from bs4 import BeautifulSoup

# Get prod name
r = requests.get('https://www.off---white.com/en/GB/products/omia065s188000160100')
soup = BeautifulSoup(r.text, 'html.parser')
spans = soup.find_all('span', {'class' : 'prod-title'})
data = [span.get_text() for span in spans]
prod_name = ''.join(data)

# Find prod price
spans = soup.find_all('div', {'class' : 'price'})
data = [span.get_text() for span in spans]
prod_price = ''.join(data)

# Find prod img
spans = soup.find_all('img', {'id' : 'image-0'})

for meta in spans:
    prod_img = meta.attrs['src']

print(prod_name)
print(prod_price)
print(prod_img)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...