Вы используете BeautifulSoup 4 , правильно?
Имена методов изменены с 3 на 4. ( документ )
Кроме того, find_all
принимает имя тега и необязательный параметр class_
для класса css (см. Этот SO ответ )
Таким образом, ваш код должен использовать новое имя:
# content = soup.findAll("content")
content = soup.find_all('div', class_=['text','show-more__control'])
Также используйте get_text()
в вашем понимании списка:
# list_content = [c.text_content() for c in content]
list_content = [tag.get_text() for tag in content]
Наконец, предоставьте парсер при получении супа: ( документ )
soup = BeautifulSoup(driver.page_source, features="html.parser")
В противном случае вы столкнетесь с этим предупреждением пользователя:
SO56261323.py: 36: Предупреждение пользователя: синтаксический анализатор не был указан явно, поэтому
Я использую лучший доступный HTML-парсер для этой системы
( "Html.parser"). Обычно это не проблема, но если вы запустите это
код в другой системе или в другой виртуальной среде, это может
используйте другой парсер и ведите себя по-другому.