parse_ig.py
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from bs4 import BeautifulSoup
from InstagramAPI import InstagramAPI
import time
c = webdriver.Chrome()
# load IG page here, whether a hashtag or a public user's page using c.get(url)
for i in range(10):
c.send_keys(Keys.END)
time.sleep(1)
soup = BeautifulSoup(c.page_source, 'html.parser')
ids = [a['href'].split('/') for a in soup.find_all('a') if 'tagged' in a['href']]
Получив идентификаторы, вы можете использовать старый API Instagram, чтобы получить данные для них. Я не уверен, что это все еще работает, но был API, который я использовал - который был ограничен тем, насколько FB медленно осуждает части старого API. Вот ссылка на тот случай, если вы не хотите получать доступ к Instagram API самостоятельно:)
Вы также можете добавить улучшения в этот простой код. Как и вместо цикла «for», вы можете вместо этого выполнить цикл «while» (то есть, пока страница все еще загружается, продолжайте нажимать кнопку END.)