Для моего задания я пытаюсь собрать информацию со следующего сайта: https://www.blueroomcinebar.com/movies/now-showing/.
Мой код должен найти названия фильмов, время и постеры. И время показа фильма, и постеры отображаются в списке, который я создал, в соответствии с порядком их появления в HTML, однако названия отображаются в алфавитном порядке.
Нам не разрешено использовать BeautifulSoup
Это мой текущий код для просмотра фильмов:
from re import findall, finditer, MULTILINE, DOTALL
from urllib.request import urlopen
movies_name = []
movies_times = []
movies_image = []
movies_list = []
movies_page = urlopen("https://www.blueroomcinebar.com/movies/now-showing/").read().decode('utf-8')
#Add movies to Movies at Blue Room Screen
find_movie_names = findall(r'<h1>(.*?)</h1>', movies_page)
find_movie_times = findall(r'<p>([0-9]{1,2}:[0-9]{2} AM|PM)</p>', movies_page)
find_movie_image = findall(r'<div class="poster" style="background-image: url\((.*?)\)">', movies_page)
print(find_movie_names)
#Add movies to arrays
for movie in find_movie_names:
movies_name.append(movie)
for movie in find_movie_times:
movies_times.append(movie)
for movie in find_movie_image:
movies_image.append(movie)
print(movies_name)
print(movies_image)
for movie in range(len(movies_name)):
movies_list.append("{};{};{}".format(movies_name[movie], movies_times[movie], movies_image[movie - 1]))
В настоящее время имена находятся в списке в порядке
['Aladdin', 'Avengers: Endgame', 'Chandigarh Amritsar Chandigarh', 'John Wick - Parabellum', 'Long Shot', 'Pokemon Detective Pikachu', 'Poms', 'The Hustle', 'Top End Wedding']
Они должны быть в следующем порядке:
['Avengers: Endgame', 'Long Shot', 'Pokemon Detective Pikachu', 'The Hustle', 'John Wick - Parabellum', 'Aladdin', 'Chandigarh Amritsar Chandigarh']
N.P.
Может быть фильм, который появляется во второй раз с предшественником OCAP. Я не уверен на 100%, почему это так, но, похоже, это какой-то особенный показ, который каждый день вращается в разных фильмах.