Помогите разобрать страницу с python - PullRequest
0 голосов
/ 27 января 2010

Я хотел бы проанализировать веб-страницу, чтобы получить URL-адрес загрузки видео. Я использую python и firebug, но не могу получить ссылку на URL.

Пример:

URL, по которому я должен получить ссылку на видео: hxxp: //www.rtve.es/mediateca/videos/20100125/saber-comer---salsa-verde-judiones-25-01-10/676590.shtml "

видео hxxp: //www.rtve.es/resources/TE_SSAC011/flv/8/2/1264426362028.flv Не могли бы вы мне помочь, пожалуйста? Большое спасибо и извините за мой английский!

Ответы [ 3 ]

5 голосов
/ 27 января 2010

Используйте BeautifulSoup или lxml.

0 голосов
/ 27 января 2010

@ OP, эти видео создаются с помощью javascript. По этой теме см. здесь . Или найдите в Google ссылки.

0 голосов
/ 27 января 2010
import re 
from urllib2 import urlopen
text = urlopen('http://www.rtve.es/mediateca/videos/20100125/saber-comer---salsa-verde-judiones-25-01-10/676590.shtm').read()
reg = re.compile(r'http://www\.rtv.*flv')
reg.findall(text)

Нормально вы можете использовать это. Но внутри вашей ссылки нет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...