Я пытаюсь извлечь комментарии с сайта, и всякий раз, когда есть ответ на комментарий, предыдущий пост включается в комментарии. Я пытаюсь игнорировать эти ответы при извлечении
url = "https://www.f150forum.com/f118/do-all-2018-f150-trucks-come-adaptive-cruise-control-369065/index2/"
page = requests.get(url)
soup = BeautifulSoup(page.text, 'html.parser')
comments_lst= soup.findAll('div',attrs={"class":"ism-true"})
comments =[]
for item in comments_lst:
result = [item.get_text(strip=True, separator=" ")]
comments.append(result)
quotes = []
for item in soup.findAll('div',attrs={"class":"panel alt2"}):
result = [item.get_text(strip=True, separator=" ")]
quotes.append(result)
Для окончательного результата я не хочу, чтобы данные из списка котировок были включены в мои комментарии. Я пытался использовать if, но это дает неверный результат.
Пример комментариев [6] дает ниже результат
'Quote: Originally Posted by jeff_the_pilot What the difference between adaptive cruise control on 2018 versus 2017? I believe mine brakes if I encroach another vehicle. It will work in stop and go traffic!'
мой ожидаемый результат
It will work in stop and go traffic!