CNTK Python API: доступ к слоям после загрузки модели - PullRequest
0 голосов
/ 19 июня 2019

Я не могу получить доступ к слоям после загрузки модели.

Я создал модель следующим образом:

def create_model(vocab_dim, hidden_dim):

    input_seq_axis1 = Axis('inputAxis1')
    input_sequence_before = sequence.input_variable(shape=vocab_dim, sequence_axis=input_seq_axis1, is_sparse = use_sparse)
    input_sequence_after = sequence.input_variable(shape=vocab_dim, sequence_axis=input_seq_axis1, is_sparse = use_sparse)
    e=Sequential([
        C.layers.Embedding(hidden_dim),
        Stabilizer()
        ],name='Embedding')
    a = Sequential([
        e,  
        C.layers.Recurrence(C.layers.LSTM(hidden_dim//2),name='ForwardRecurrence'),
        ],name='ForwardLayer')
    b = Sequential([
        e,  
        C.layers.Recurrence(C.layers.LSTM(hidden_dim//2),go_backwards=True),
       ],name='BackwardLayer')
    latent_vector = C.splice(a(input_sequence_before), b(input_sequence_after))

    bias = C.layers.Parameter(shape = (vocab_dim, 1), init = 0, name='Bias')
    weights = C.layers.Parameter(shape = (vocab_dim, hidden_dim), init = C.initializer.glorot_uniform(), name='Weights')
    z = C.times_transpose(weights, latent_vector,name='Transpose') + bias
    z = C.reshape(z, shape = (vocab_dim))

    return z

Тогда я загружаю модель:

def load_my_model(vocab_dim, hidden_dim):

    z=load_model("models/lm_epoch0.dnn")
    input_sequence_before = z.arguments[0]
    input_sequence_after = z.arguments[1]
    a=z.ForwardLayer
    b=z.BackwardLayer
    latent_vector = C.splice(a(input_sequence_before), b(input_sequence_after))

Я получаю сообщение об ошибке: TypeError («аргумент типа ForwardRecurrence SequenceOver [inputAxis1] [Tensor [100]] несовместим с типом SequenceOver [inputAxis1] [SparseTensor [50000]] передаваемой переменной»,)

Похоже, что слой, на который ссылается имя (z.ForwardLayer), представляет функцию из непосредственного ввода слоя. Как я могу вычислить "latent_vector" (мне нужна эта переменная для создания функций кросс-энтропии и потерь для продолжения обучения)?

1 Ответ

1 голос
/ 20 июня 2019

На основании ошибки размеры вашего входного seq слишком велики (5000) по сравнению с тем, что ожидает ваш ForwardLayer (100).

Когда вы выбираете узел ForwardLayer с помощью z.ForwardLayer, вы тольковыберите этот очень специфический узел / слой, но не слои / узлы / остальные графы вычислений, которые связаны с ним.

Вы должны сделать a = C.combine([z.ForwardLayer.owner]), и у вас все будет хорошо.

...