Программа очистки веб-страниц случайно не будет работать - вернуть пустой список - PullRequest
0 голосов
/ 18 декабря 2018

Я новичок в изучении веб-страниц и сталкиваюсь с постоянной проблемой.У меня есть скрипт, который собирает информацию о предстоящих ценах на билеты от stubhub и запрограммирован на ежедневный запуск для сбора данных о командах, датах и ​​самой низкой цене.Мой сценарий работал нормально в течение нескольких дней, прежде чем попытки извлечь цены с помощью BeautifulSoup закончились бы пустыми.Через день программа снова запустилась, как и ожидалось, без изменений.Теперь он снова не работает и не работает должным образом более недели.Я действительно ломаю голову над этим, так как я не вносил никаких изменений в код, и попытки обходных путей оказались с пустыми руками.

Вот фрагмент кода:

#import modules 
import requests,bs4,re
from fake_useragent import UserAgent
import pandas as pd
import datetime
from dateutil import parser

# StubHub
user_agent= UserAgent()
header = {'User-Agent':str(user_agent.chrome)}
res = requests.get('https://www.stubhub.com/washington-capitals-tickets/performer/762/',headers=header)
res.raise_for_status()

#parse
soup = bs4.BeautifulSoup(res.text,'html.parser')

# list of prices for events 
links_tix = soup.find_all("div",class_="EventItem__Price")
tix_re = '\d+'
prices = [] 
for i in links_tix: # find list of cheapest prices  
    prices.append(re.findall(tix_re,str(i)))

Будем весьма благодарны за любые предложения о том, что может привести к тому, что метод soup.findall () окажется пустым.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...