DL4J: неправильный размер ввода - ожидаемая матрица - PullRequest
0 голосов
/ 30 мая 2020

Я пытаюсь заставить мою сеть оценить INDArray. Это моя сеть: publi c class DQN {

private final int inputSize;
private final int outputSize;
private final MultiLayerNetwork network;


public DQN(int inputSize, int outputSize){

    this.inputSize = inputSize;
    this.outputSize = outputSize;

    MultiLayerConfiguration config = setConfig();
    this.network = new MultiLayerNetwork(config);
    this.network.init();
}

private MultiLayerConfiguration setConfig(){
    return new NeuralNetConfiguration.Builder()
            .seed(12345)
            .weightInit(WeightInit.XAVIER)
            .updater(new AdaGrad(0.5))
            .activation(Activation.RELU)
            .optimizationAlgo(OptimizationAlgorithm.STOCHASTIC_GRADIENT_DESCENT)
            .l2(0.0001)
            .list()
            .layer(0, new DenseLayer.Builder().nIn(this.inputSize).nOut(250).weightInit(WeightInit.XAVIER).activation(Activation.RELU) //First hidden layer
                    .build())
            .layer(1, new OutputLayer.Builder().nIn(250).nOut(this.outputSize).weightInit(WeightInit.XAVIER).activation(Activation.SOFTMAX) //Output layer
                    .lossFunction(LossFunctions.LossFunction.NEGATIVELOGLIKELIHOOD)
                    .build())
            .build();
}

public INDArray evaluate(INDArray vec){
    return this.network.output(vec);
}

}

К сожалению, всякий раз, когда я пытаюсь вызвать оценку с помощью своего INDArray, я получаю:

Exception in thread "Thread-2" org.deeplearning4j.exception.DL4JInvalidInputException: Input that is not a matrix; expected matrix (rank 2), got rank 1 array with shape [23]. Missing preprocessor or wrong input type? (layer name: layer0, layer index: 0, layer type: DenseLayer)
    at org.deeplearning4j.nn.layers.BaseLayer.preOutputWithPreNorm(BaseLayer.java:308)
    at org.deeplearning4j.nn.layers.BaseLayer.preOutput(BaseLayer.java:291)
    at org.deeplearning4j.nn.layers.BaseLayer.activate(BaseLayer.java:339)
    at org.deeplearning4j.nn.layers.AbstractLayer.activate(AbstractLayer.java:258)
    at org.deeplearning4j.nn.multilayer.MultiLayerNetwork.outputOfLayerDetached(MultiLayerNetwork.java:1303)
    at org.deeplearning4j.nn.multilayer.MultiLayerNetwork.output(MultiLayerNetwork.java:2415)
    at org.deeplearning4j.nn.multilayer.MultiLayerNetwork.output(MultiLayerNetwork.java:2378)
    at org.deeplearning4j.nn.multilayer.MultiLayerNetwork.output(MultiLayerNetwork.java:2369)
    at org.deeplearning4j.nn.multilayer.MultiLayerNetwork.output(MultiLayerNetwork.java:2356)
    at org.deeplearning4j.nn.multilayer.MultiLayerNetwork.output(MultiLayerNetwork.java:2452)
    at wmaclean.rl.dqn.DQN.evaluate(DQN.java:51)

Мои входные данные - это векторы ранга 1 с 23 элементами, но net, похоже, нуждается в матрице. Кто-нибудь знает почему? Спасибо :)

1 Ответ

0 голосов
/ 30 мая 2020

Нашел свою проблему. Тем, у кого есть подобные проблемы, убедитесь, что вы указали форму при создании INDArray:

Nd4j.create(data, **new int[]{1, vectorSizeCount}**)
...