Невозможно получить заголовки видео и URL из некоторого json контента - PullRequest
0 голосов
/ 11 апреля 2020

Я пытаюсь создать сценарий python для анализа titles и video urls, доступных в любой данной ссылке, как в эта . Что я мог заметить, что контент, который я sh должен получить, генерируется динамически, поэтому модуль запросов не должен их захватывать. Однако, поскольку содержимое доступно в источнике страницы в некотором теге скрипта, я уже вычеркнул необходимый контент с помощью регулярных выражений. Я попытался подчеркнуть тип результатов на изображении, которое я хочу получить.

enter image description here

Я уже написал.

import re
import json
import requests

link = "https://www.youtube.com/watch?v=J77cz4mqolA"

with requests.Session() as s:
    s.headers['User-Agent'] = 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36'
    res = s.get(link)
    item = re.findall(r'window\["ytInitialData"\][^{]+(.*);', res.text)[0]
    print(json.loads(item))

Как получить заголовки видео и URL-адреса из json контента?

...