Я пытаюсь очистить Instagram с селеном с помощью Chrome Webdriver.Мне нужно получить информацию об ответе XHR, и я попробовал "browsermob-proxy", и этой информации было недостаточно:
server = Server("/home/doruk/Downloads/browsermob-proxy 2.1.4/bin/browsermob-proxy")
server.start()
time.sleep(1)
proxy = server.create_proxy()
time.sleep(1)
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument("--proxy-server={0}".format(proxy.proxy))
browser = webdriver.Chrome(chrome_options=chrome_options)
##############################################
####This is output of proxy.har in json format.
{
"comment": "",
"serverIPAddress": "155.245.9.55",
"pageref": "",
"startedDateTime": "2018-05-21T16:44:41.053+03:00",
"cache": {},
"request": {
"comment": "",
"cookies": [],
"url": "https://scontent-sof1-1.cdninstagram.com/vp/e95312434013bc43a5c00c458b53022cb/5BC46751/t51.2885-19/s150x150/26432586_139925760144086_726193654523232256_n.jpg",
"queryString": [],
"headers": [],
"headersSize": 528,
"bodySize": 0,
"method": "GET",
"httpVersion": "HTTP/1.1"
},
, когда я нажимаю "Загрузить дополнительные комментарии" в контенте, ссылка примерно такая
https://www.instagram.com/graphql/query/?query_hash=33ba35000cb50da46f5b5e889df7d159&variables=%7B"shortcode"%3A"Bi9ZURdA6Gn"%2C"first"%3A36%2C"after"%3A"AQBr-wP7U4Ykr1QRH7PYJ1a0KQivhS0Ndwae-5F8vrZ5sf1eA_Bfgn4dZ0ql0pwUf9GXPm_LPyhtCnlhH6YOHfuNstwXK9VZuUIR4zD3k24s6Q"%7D
появляется, и мне нужна эта информация внутри него.Есть ли способ справиться с этой ситуацией?
мне нужна только вещь "? Query_hash =".
Пример представления