Python чтение данных не работает должным образом - PullRequest
2 голосов
/ 07 марта 2020

Итак, я написал этот код для объединения двух каталогов с данными из этого набора данных: https://www.kaggle.com/iarunava/cell-images-for-detecting-malaria

data=[]
labels=[]
for img in parasitized_data:
  try:
    img_read=plt.imread('drive/My Drive/Malaria detection/cell_images/Parasitized'+'/'+img)
    img_resize=cv2.resize(img_read,(50,50))
    img_array=img_to_array(img_resize)
    data.append(img_array)
    labels.append(1)
  except:
    None
for img in uninfected_data:
  try:
    img_read=plt.imread('drive/My Drive/Malaria detection/cell_images/Uninfected'+'/'+img)
    img_resize=cv2.resize(img_read,(50,50))
    img_array=img_to_array(img_resize)
    data.append(img_array)
    labels.append(0)
  except:
    None

Дело в том, что он работает для паразитированных данных, но не для незараженные данные. Я попытался распечатать img_read и img_resize et c. которые, кажется, работают просто отлично.

Ответы [ 2 ]

0 голосов
/ 08 марта 2020

Я наконец нашел ответ: Это был тайм-аут на Драйве! Я загрузил файл в виде Zip, распакуйте его и удалите Thumbs.db, и все работает отлично. Спасибо за вашу помощь!

0 голосов
/ 07 марта 2020

Ответ заключается в ошибке:

"не удается идентифицировать файл образа" диск / Мой диск / обнаружение малярии / cell_images / Parasitized / Thumbs.db '"

Как видите, вы пытаетесь прочитать файл .db как изображение. Удалите это из своих списков, и тогда оно должно работать!

...