Я пытаюсь извлечь весь текст статьи со следующего сайта: https://www.phonearena.com/reviews/Samsung-Galaxy-S9-Plus-Review_id4494
Я пытался findAll(text=True)
, но он извлекает много бесполезной информации.
Так я и сделал findAll(text=True, recursive=False)
но игнорирует текстовые данные в определенных тегах, как?Какой наиболее эффективный способ извлечения текста в этом случае?