Caffe MLP пример - PullRequest
       11

Caffe MLP пример

0 голосов
/ 04 июня 2019

Я пытаюсь научиться кофе, используя пример xor.

Я перехожу по этой ссылке с веб-сайта кафе, но они делают CNN.

Я пытаюсь следовать учебнику и застрял, когда дело доходит до компиляции модели.

Я сделал prototxt файл, описывающий архитектуру модели, я пытаюсь создать двухслойную сеть xor. Мой код ниже:

name: "xor_test"

layer {
  name: "data"
  type: "Data"
  transform_param {
    scale: 1
  }
  data_param {
    source: "0 0 0
             1 0 1
             0 1 1
             1 1 0"

    backend: LMDB
    batch_size: 1
  }
  top: "data"
  top: "data"
}

layer {
  name: "ip1"
  type: "InnerProduct"
  param { lr_mult: 1 }
  param { lr_mult: 2 }
  inner_product_param {
    num_output: 3
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
  bottom: "data"
  top: "ip1"
}

layer {
  name: "tanh1"
  type: "Tanh"
  bottom: "ip1"
  top: "ip1"
}

layer {
  name: "ip2"
  type: "InnerProduct"
  param { lr_mult: 1 }
  param { lr_mult: 2 }
  inner_product_param {
    num_output: 1
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
  bottom: "ip1"
  top: "ip2"
}

layer {
  name: "tanh2"
  type: "Tanh"
  bottom: "ip2"
  top: "ip2"
}

Я не знаю, верна ли эта модель, я не могу найти другие примеры для справки.

После этого в руководстве говорится, что необходимо создать файл решателя prototxt, который ссылается на ранее созданный файл.

net: "test.prototxt"
test_iter: 2
test_interval: 5
base_lr: 0.01
momentum: 0.9
weight_decay: 0.0005
lr_policy: "inv"
gamma: 0.0001
power: 0.75
display: 5
# The maximum number of iterations
max_iter: 10
# solver mode: CPU or GPU
solver_mode: CPU

Я не уверен, как обучить или протестировать модель, поскольку мои входные данные не являются изображениями.

1 Ответ

0 голосов
/ 04 июня 2019

Ваш входной слой неверен.Поскольку вы не используете изображения в качестве входных данных, а скорее просто двоичные векторы, вы можете рассмотреть возможность использования слоя HDF5Data для ввода.
Здесь есть хороший пример о том, каксоздайте и используйте этот слой входных данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...