У меня есть папка poster_folder
, содержащая файлы jpg, например, 1.jpg, 2.jpg, 3.jpg
Путь к этой папке:
from pathlib import Path
from PIL import Image
images_dir = Path('C:\\Users\\HP\\Desktop\\PGDinML_AI_IIITB\\MS_LJMU\\Dissertation topics\\Project_2_Classification of Genre for Movies using Machine Leaning and Deep Learning\\Final_movieScraping_data_textclasification\\posters_final').expanduser()
У меня есть фрейм данных с информацией об изображении в формате jpg:
df_subset_cleaned_poster.head(3)
movie_name movie_image
Lion_king 1.jpg
avengers 2.jpg
iron_man 3.jpg
Я пытаюсь нанести разброс ширины и высоты всех файлов jpg (так как они имеют разное разрешение) в папке, как показано ниже:
height, width = np.empty(len(df_subset_cleaned_poster)), np.empty(len(df_subset_cleaned_poster))
for i in range(len(df_subset_cleaned_poster.movie_image)):
w, h = Image.open(images_dir.joinpath(df_subset_cleaned_poster['movie_image'][i])).size
width[i], height[i] = w, h
plt.scatter(width, height, alpha=0.5)
plt.xlabel('Width'); plt.ylabel('Height'); plt.show()
Это ошибка метания: KeyError: 208
df_subset_cleaned_poster.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 10225 entries, 0 to 10986
Data columns (total 2 columns):
movie_name 10225 non-null object
movie_image 10225 non-null object
dtypes: object(2)