У меня есть цикл, который постоянно добавляет переменную с неизвестным значением в список, а затем печатает список.Однако я не нахожу способ игнорировать ранее найденные значения и добавленные в список, когда я хочу напечатать список в следующий раз.
Я очищаю постоянно обновляемый веб-сайт для ссылок соответствия ключевых слов, используязапросы и bs4 внутри цикла.Как только на сайте добавлены ссылки, я ищу свой код, добавляю их в список и распечатываю список.Как только веб-сайт добавит следующую волну совпадающих ссылок, они также будут добавлены в мой список, однако мой код также снова добавит найденные ранее старые ссылки в список, поскольку они по-прежнему соответствуют моему ключевому слову.Можно ли игнорировать эти старые ссылки?
url = "www.website.com"
keyword = "news"
results = [] #list which saves the links
while True:
source = requests.get(url).text
soup = BeautifulSoup(source, 'lxml')
options = soup.find_all("a", class_="name-link")
for o in options:
if keyword in o.text:
link = o.attrs["href"] #the links I want
results.append(link) #adds links to list
print(results)
time.sleep(5) #wait until next scrape
#so with every loop the value of 'link' is changing which makes it hard
for me to find a way to ignore previously found links
Чтобы облегчить понимание, вы могли бы подумать о цикле, добавляющем неизвестное число в список при каждом выполнении цикла, но номер должен толькопечататься в первом исполнении.