Веб Соскреб видео - PullRequest
       8

Веб Соскреб видео

0 голосов
/ 07 ноября 2018

Я пытаюсь сделать доказательство концепции, загрузив телевизионный эпизод Боберса Боба в https://www.watchcartoononline.com/bobs-burgers-season-9-episode-3-tweentrepreneurs.

Я не могу понять, как извлечь URL видео с этого сайта. Я использовал инструменты веб-разработчика Chrome и Firefox, чтобы выяснить, находится ли он в iframe, но при извлечении URL-адресов src с BeautifulSoup, который ищет iframes, возвращает ссылки, которые не имеют никакого отношения к видео. Где ссылки на файлы mp4 или flv (которые я вижу в Инструментах разработчика - даже если щелкать их запрещено).

Буду признателен за понимание того, как выполнять очистку веб-видео с помощью BeautifulSoup и запросов.

Вот код, если нужно. Во многих руководствах говорится, что используются теги «a», но я не получил тегов «a».

import requests
from bs4 import BeautifulSoup

r = requests.get("https://www.watchcartoononline.com/bobs-burgers-season-9-episode-5-live-and-let-fly")
soup = BeautifulSoup(r.content,'html.parser')
links = soup.find_all('iframe')
for link in links:
    print(link['src'])

1 Ответ

0 голосов
/ 07 ноября 2018
import requests
url = "https://disk19.cizgifilmlerizle.com/cizgi/bobs.burgers.s09e03.mp4?st=_EEVz36ktZOv7ZxlTaXZfg&e=1541637622"
def download_file(url,filename):
    # NOTE the stream=True parameter
    r = requests.get(url, stream=True)
    with open(filename, 'wb') as f:
        for chunk in r.iter_content(chunk_size=1024): 
            if chunk: # filter out keep-alive new chunks
                f.write(chunk)
                #f.flush() commented by recommendation from J.F.Sebastian       
    return filename

download_file(url,"bobs.burgers.s09e03.mp4")

Этот код загрузит этот конкретный эпизод на ваш компьютер. URL-адрес видео находится внутри тега <video> в теге <source>.

...