Как собрать информацию о фильмах с сайта IMDB? - PullRequest
0 голосов
/ 13 мая 2019

Я новичок в Python и пытаюсь очистить IMDB.Я собираю список из 250 лучших фильмов IMDB и хочу получить информацию о каждом уникальном веб-сайте, например, длину каждого фильма.

У меня уже есть список уникальных URL.Итак, я хочу перебрать этот список, и для каждого URL в этом списке я хочу получить «длину» этого фильма.Возможно ли это сделать в одном коде?

for URL in urlofmovie:
    htmlsource = requests.get(URL)
    tree_url = html.fromstring(htmlsource)
    lengthofmovie = tree_url.xpath('//*[@class="subtext"]')

Я ожидаю, что lengthofmovie станет списком всех длин фильмов.Однако в строке 2 это уже идет не так: htmlsource.

1 Ответ

2 голосов
/ 13 мая 2019

Чтобы сделать его списком, вы должны сначала создать список, а затем добавить каждую длину к этому списку.

length_list = []
for URL in urlofmovie:
    htmlsource = requests.get(URL)
    tree_url = html.fromstring(htmlsource)
    length_list.append(tree_url.xpath('//*[@class="subtext"]'))

Небольшой совет : Поскольку вы новичок в Python, я бы предложилвам перейти на PEP8 конвенций .Ваше именование переменных может облегчить вашу (и другим разработчикам) жизнь.(urlofmovie -> urls_of_movies)

Однако в строке 2: htmlsource это уже не так.

Пожалуйста, предоставьте исключение, которое вы получаете.

...