Не могу получить доступ к определенным тегам, используя красивый суп - PullRequest
2 голосов
/ 24 января 2020

Я пытаюсь очистить изображения продуктов со страниц продукта Amazon.in и запускаю возвращенные значения html через bs4. Когда я просматриваю html в консоли разработчика Firefox, я вижу все изображения, встроенные в отдельные теги <li>, и одновременно виден только один из них.

Любое изображение, кроме основного посадочного изображения, становится видимым после наведения на его миниатюру слева от основного изображения. Когда я пытаюсь получить содержимое этих тегов <li> с помощью bs4, я использую метод find_all() для получения всех соответствующих тегов, содержащих изображения.

Однако, когда я делаю это. Я могу только получить изображение посадки, которое первоначально отображается, и ни одно другое изображение, содержащее теги <li>, не выводится. Я не могу понять, почему, поскольку все эти теги присутствуют в HTML при просмотре в консоли браузера. Я собираюсь прибегнуть к безголовой реализации браузера?

...