Нет данных, извлеченных из Instagram - PullRequest
0 голосов
/ 01 ноября 2018

Поскольку API Instagram не работает, я пытаюсь просканировать информацию о данном хэштеге. На странице поиска Hash-Tag встроен Ajax, поэтому я следовал правилам в Интернете, чтобы найти URL, по которому извлекаются данные. Тогда у меня есть следующая ссылка.

https://www.instagram.com/graphql/query/?query_hash=f92f56d47dc7a55b606908374b43a314&variables=%7B%22tag_name%22%3A%22cancun%22%2C%22show_ranked%22%3Afalse%2C%22first%22%3A20%2C%22after%22%3A%22QVFENlVELW9hZjlJVWU1RWd6anpWdGNsYkVwU3M5TzUtaDlRN3VoRHlwU1EwWWRBZ2t6TFkzbEl1M3RRcmItd0JKbVBiM2pLUXZpT0JzNWp3dFhIcElfWg%3D%3D%22%7D

Однако, когда я пытаюсь сканировать эту страницу с помощью Urlopen, Instagram блокирует мой сканер. Я пытался использовать User-Agent, чтобы обойти это, и он не работает. Затем я попытался использовать Webdriver для фальсификации браузера, он обходит блокировку, но я ничего не получаю от сканирования. Кто-нибудь знает, что с этим не так.

options = webdriver.ChromeOptions()
options.add_argument('headless') 
driver.get(url)
pagesource = driver.page_source
bsObj = BeautifulSoup(pagesource,'html.parser')
print(bsObj.prettify())

Цени любую помощь!

...