Как я могу получить правильный html код для очистки с Python с помощью BeautifulSoup? - PullRequest
0 голосов
/ 30 апреля 2020

для образовательных целей, я хотел бы очистить библиотеку объявлений Facebook, используя python.

Например, скажем, что я хотел бы почистить эту страницу :

Когда я проверяю элемент, я вижу различные виды div, которые я могу использовать для извлечения информации , Но когда я пытаюсь получить код этой страницы html с помощью BeautifulSoup, я получаю совершенно другой код, чем тот, который я видел при проверке элемента.

Вот что я получаю.

А это мой код:

import requests
from bs4 import BeautifulSoup
r = requests.get("https://www.facebook.com/ads/library/?active_status=all&ad_type=all&country=ALL&impression_search_field=has_impressions_lifetime&view_all_page_id=51212153078&sort_data[direction]=desc&sort_data[mode]=relevancy_monthly_grouped")
c=r.content
soup = BeautifulSoup(c,"html.parser")
print(soup.prettify())

Знаете ли вы, как я могу получить доступ к коду что я вижу, осматривая страницу? Большое спасибо!

PS Как видите, я очень новичок в кодировании, поэтому, если у вас есть предложения о том, как лучше поделиться кодом, который я только что связал, я был бы очень рад узнать, как это сделать. это и редактировать мой пост соответственно.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...