Мне нужно собрать некоторую информацию, которую не предоставляет Facebook Analytics. Например, исходный URL и заголовок статьи, рекламируемой в Facebook как ссылка. Эта информация скрыта в html-коде поста в Facebook, но я изо всех сил пытаюсь ее найти Буду признателен за вашу помощь.
Давайте рассмотрим этот пример: https://www.facebook.com/bbcnews/posts/10156428513547217
Я определил классы для ссылки (bbc.in ...): "_6ks"
и заголовок: 'mbs _6m6 _2cnj _5s6c'
Код ниже ничего не возвращает:
from bs4 import BeautifulSoup
import requests
link = 'https://www.facebook.com/bbcnews/posts/10156428513547217'
r = requests.get(link)
soup = BeautifulSoup(r.content, "lxml")
for paragraph in soup.find_all("div", class_="_6ks"):
for a in paragraph("a"):
print(a.get('href'))
for paragraph in soup.find_all("div", class_='mbs _6m6 _2cnj _5s6c'):
for a in paragraph("a"):
print(a.get('hover'))