Паутина скребет паровую распродажу - PullRequest
0 голосов
/ 17 января 2019

В настоящее время я пытаюсь очистить страницу распродажи в магазине через Интернет, однако могу вычеркнуть все названия и скидки, однако не знаю, как удалить теги из данных

Мой код:

import bs4 as bs
import urllib.request

#opening a connection 
my_url = urllib.request.urlopen('https://store.steampowered.com/search/?specials=1&os=win').read()


#turning the html into a beautifulsoup object
soup = bs.BeautifulSoup(my_url, 'lxml')
def remove_tags(text):
    return ''.join(xml.etree.ElementTree.fromstring(text).itertext())

data_discounts = (soup.find_all('div', {'class':'col search_discount responsive_secondrow'}))
data_body = (soup.find_all('span', {'class':'title'}))
print (data_body)

1 Ответ

0 голосов
/ 17 января 2019

попробуйте это:

for item in data_body:
    print(item.text)  # may need print(item[0].text)
...