Как сканировать веб-страницу и получать изображения и встраивания на YouTube? - PullRequest
2 голосов
/ 07 ноября 2008

Я создаю веб-приложение, в котором мне нужно получить все изображения и любые флэш-видео, которые встроены (например, YouTube) по заданному URL-адресу. Я использую Python.

Я гуглил, но не нашел никакой хорошей информации по этому поводу (вероятно, потому что я не знаю, как это называется искать), есть ли у кого-нибудь опыт с этим и знает, как это сделать? 1003 *

Я бы хотел увидеть примеры кода, если они есть.

Спасибо!

1 Ответ

7 голосов
/ 07 ноября 2008

BeautifulSoup - отличная библиотека для очистки экрана. Используйте urllib2 для извлечения страницы и BeautifulSoup для ее разбора. Вот пример кода из их документов:

import urllib2
from BeautifulSoup import BeautifulSoup

page = urllib2.urlopen("http://www.icc-ccs.org/prc/piracyreport.php")
soup = BeautifulSoup(page)
for incident in soup('td', width="90%"):
    where, linebreak, what = incident.contents[:3]
    print where.strip()
    print what.strip()
    print
...