Керас: генератор данных - PullRequest
       4

Керас: генератор данных

0 голосов
/ 21 февраля 2019
  • Я видел этот код для использования генератора keras (*)
  • , но когда я запускаю "__data_generation", python жалуется на звездочку в "* self.dim" с сообщениемMsgstr "Ошибка синтаксиса: неверный синтаксис".Знаете ли вы, если я должен использовать "звездочку"?
  • если я удаляю его и использую только «self.dim», то при создании np я получаю сообщение об ошибке «Объект TypeError: 'tuple' не может быть интерпретирован как индекс".
  • Знаете ли вы, чтобы исправить эту проблему?Я использую Python 2.7.5.

(*)

import numpy as np
import keras

class DataGenerator(keras.utils.Sequence):

def __init__(self, list_IDs, labels, batch_size=10, dim=(32,32), n_channels=1, n_classes=10, shuffle=True):<br> 
    self.dim = dim
    self.batch_size = batch_size
    self.labels = labels
    self.list_IDs = list_IDs
    self.n_channels = n_channels
    self.n_classes = n_classes
    self.shuffle = shuffle
    self.on_epoch_end()

def __len__(self):
    'Denotes the number of batches per epoch'
    return int(np.floor(len(self.list_IDs) / self.batch_size))

def __getitem__(self, index):
    'Generate one batch of data'
    indexes = self.indexes[index*self.batch_size:(index+1)*self.batch_size]

    # Find list of IDs
    list_IDs_temp = [self.list_IDs[k] for k in indexes]

    # Generate data
    X, y = self.__data_generation(list_IDs_temp)

    return X, y

def on_epoch_end(self):
    'Updates indexes after each epoch'
    self.indexes = np.arange(len(self.list_IDs))
    if self.shuffle == True:
        np.random.shuffle(self.indexes)

def __data_generation(self, list_IDs_temp):
    'Generates data containing batch_size samples' # X : (n_samples, *dim, n_channels)
    # Initialization
    X = np.empty((self.batch_size, *self.dim, self.n_channels))
    y = np.empty((self.batch_size), dtype=int)

    # Generate data
    for i, ID in enumerate(list_IDs_temp):
        # Store sample
        X[i,] = np.load('data/' + ID + '.npy')

        # Store class
        y[i] = self.labels[ID]

return X, keras.utils.to_categorical(y, num_classes=self.n_classes)

1 Ответ

0 голосов
/ 21 февраля 2019

Ну, *self.dim используется для распаковки контейнера в качестве аргумента.В основном это означает, что вы передаете self.dim, и функция обрабатывает его как кортеж, который нужно распаковать внутри функции.См. this для более широкого объяснения (раздел «Для распаковки контейнеров»).

В вашем случае вы используете его в:

X = np.empty((self.batch_size, *self.dim, self.n_channels))

где np.empty()ожидает кортеж, содержащий int (или один int) в качестве первого аргумента.В вашем случае вы передаете кортеж, содержащий кортеж в качестве второго элемента.Вы должны распаковать его самостоятельно, чтобы он работал следующим образом:

X = np.empty((self.batch_size, self.dim[0], self.dim[1], self.n_channels))

Итак, вам следует придерживаться части *, но по-разному трактовать аргумент.Кроме того, *arg обладает большей гибкостью, что означает, что он может работать с контейнерами с 2, 3 и т. Д. Элементами, которые будут иметь жестко запрограммированный фрагмент кода, подобный args[0], args[1].

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...