Я пытаюсь создать сценарий python для анализа titles
и video urls
, доступных в любой данной ссылке, как в эта . Что я мог заметить, что контент, который я sh должен получить, генерируется динамически, поэтому модуль запросов не должен их захватывать. Однако, поскольку содержимое доступно в источнике страницы в некотором теге скрипта, я уже вычеркнул необходимый контент с помощью регулярных выражений. Я попытался подчеркнуть тип результатов на изображении, которое я хочу получить.
Я уже написал.
import re
import json
import requests
link = "https://www.youtube.com/watch?v=J77cz4mqolA"
with requests.Session() as s:
s.headers['User-Agent'] = 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36'
res = s.get(link)
item = re.findall(r'window\["ytInitialData"\][^{]+(.*);', res.text)[0]
print(json.loads(item))
Как получить заголовки видео и URL-адреса из json контента?