Я пытаюсь использовать BeautifulSoup для разбора HTML в Python. В частности, я пытаюсь создать два массива суповых объектов: один для дат публикации на веб-сайте, а другой для самих публикаций. Однако, когда я использую findAll в классе div, который соответствует сообщениям, возвращается только начальный тег, а не текст внутри тега. С другой стороны, мой код отлично работает для дат. Что происходит ??
# store all texts of posts
texts = soup.findAll("div", {"class":"quote"})
# store all dates of posts
dates = soup.findAll("div", {"class":"datetab"})
Первая строка выше возвращает только
<div class="quote">
что не то, что я хочу. Вторая строка возвращает
<div class="datetab">Feb<span>2</span></div>
то, что я хочу (предварительное уточнение).
Понятия не имею, что я делаю не так. Здесь - это сайт, который я пытаюсь проанализировать. Это для домашней работы, и я действительно очень отчаялся.