Неправильная реализация прямой связи в нейронной сети - PullRequest
0 голосов
/ 10 июля 2020

Это нейронная сеть в сообщении, написанном Джеймсом Лоем.

А это код реализации:

import numpy as np

def sigmoid(x):
    return 1.0/(1+ np.exp(-x))

def sigmoid_derivative(x):
    return x * (1.0 - x)

class NeuralNetwork:
    def __init__(self, x, y):
        self.input      = x
        self.weights1   = np.random.rand(self.input.shape[1],4) 
        self.weights2   = np.random.rand(4,1)                 
        self.y          = y
        self.output     = np.zeros(self.y.shape)

    def feedforward(self):
        self.layer1 = sigmoid(np.dot(self.input, self.weights1))
        self.output = sigmoid(np.dot(self.layer1, self.weights2))

    def backprop(self):
        # application of the chain rule to find derivative of the loss function with respect to weights2 and weights1
        d_weights2 = np.dot(self.layer1.T, (2*(self.y - self.output) * sigmoid_derivative(self.output)))
        d_weights1 = np.dot(self.input.T,  (np.dot(2*(self.y - self.output) * sigmoid_derivative(self.output), self.weights2.T) * sigmoid_derivative(self.layer1)))

        # update the weights with the derivative (slope) of the loss function
        self.weights1 += d_weights1
        self.weights2 += d_weights2


if __name__ == "__main__":
    X = np.array([[0,0,1],
                  [0,1,1],
                  [1,0,1],
                  [1,1,1]])
    y = np.array([[0],[1],[1],[0]])
    nn = NeuralNetwork(X,y)

    for i in range(1500):
        nn.feedforward()
        nn.backprop()

    print(nn.output)

Проблема в в функции прямого распространения feedforward(self):

def feedforward(self):
        self.layer1 = sigmoid(np.dot(self.input, self.weights1))
        self.output = sigmoid(np.dot(self.layer1, self.weights2))

Первая строка из входа X линейно комбинируется с весами только первого нейрона в скрытом слое в self.layer1 = sigmoid(np.dot(self.input, self.weights1)), поэтому self.layer1[0] - это линейная комбинация весов первого нейрона и первой строки входа.

Вторая строка из входа X линейно комбинируется с весами только второго нейрона в скрытый слой в self.layer1 = sigmoid(np.dot(self.input, self.weights1)), поэтому self.layer1[1] - это линейная комбинация весов второго нейрона и второй строки ввода.

Итак:

self.layer[0] = X[0] * Weights_of_first_neuron
self.layer[1] = X[1] * Weights_of_second_neuron

Et c.

Вопрос:

Разве не должно быть так, что для каждого обучающего набора из ввода X каждая строка из X линейно комбинируется с все нейроны в скрытом слое и их соответствующие веса?

S o: для каждого обучающего набора (или ряда) из входа X:

self.layer[0] = X[current_row] * Weights_of_first_neuron
self.layer[1] = X[current_row] * Weights_of_second_neuron
self.layer[2] = X[current_row] * Weights_of_third_neuron
self.layer[3] = X[current_row] * Weights_of_fourth_neuron
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...