Я пытаюсь научиться кофе, используя пример xor.
Я перехожу по этой ссылке с веб-сайта кафе, но они делают CNN.
Я пытаюсь следовать учебнику и застрял, когда дело доходит до компиляции модели.
Я сделал prototxt
файл, описывающий архитектуру модели, я пытаюсь создать двухслойную сеть xor. Мой код ниже:
name: "xor_test"
layer {
name: "data"
type: "Data"
transform_param {
scale: 1
}
data_param {
source: "0 0 0
1 0 1
0 1 1
1 1 0"
backend: LMDB
batch_size: 1
}
top: "data"
top: "data"
}
layer {
name: "ip1"
type: "InnerProduct"
param { lr_mult: 1 }
param { lr_mult: 2 }
inner_product_param {
num_output: 3
weight_filler {
type: "xavier"
}
bias_filler {
type: "constant"
}
}
bottom: "data"
top: "ip1"
}
layer {
name: "tanh1"
type: "Tanh"
bottom: "ip1"
top: "ip1"
}
layer {
name: "ip2"
type: "InnerProduct"
param { lr_mult: 1 }
param { lr_mult: 2 }
inner_product_param {
num_output: 1
weight_filler {
type: "xavier"
}
bias_filler {
type: "constant"
}
}
bottom: "ip1"
top: "ip2"
}
layer {
name: "tanh2"
type: "Tanh"
bottom: "ip2"
top: "ip2"
}
Я не знаю, верна ли эта модель, я не могу найти другие примеры для справки.
После этого в руководстве говорится, что необходимо создать файл решателя prototxt
, который ссылается на ранее созданный файл.
net: "test.prototxt"
test_iter: 2
test_interval: 5
base_lr: 0.01
momentum: 0.9
weight_decay: 0.0005
lr_policy: "inv"
gamma: 0.0001
power: 0.75
display: 5
# The maximum number of iterations
max_iter: 10
# solver mode: CPU or GPU
solver_mode: CPU
Я не уверен, как обучить или протестировать модель, поскольку мои входные данные не являются изображениями.