Это нейронная сеть в сообщении, написанном Джеймсом Лоем.
А это код реализации:
import numpy as np
def sigmoid(x):
return 1.0/(1+ np.exp(-x))
def sigmoid_derivative(x):
return x * (1.0 - x)
class NeuralNetwork:
def __init__(self, x, y):
self.input = x
self.weights1 = np.random.rand(self.input.shape[1],4)
self.weights2 = np.random.rand(4,1)
self.y = y
self.output = np.zeros(self.y.shape)
def feedforward(self):
self.layer1 = sigmoid(np.dot(self.input, self.weights1))
self.output = sigmoid(np.dot(self.layer1, self.weights2))
def backprop(self):
# application of the chain rule to find derivative of the loss function with respect to weights2 and weights1
d_weights2 = np.dot(self.layer1.T, (2*(self.y - self.output) * sigmoid_derivative(self.output)))
d_weights1 = np.dot(self.input.T, (np.dot(2*(self.y - self.output) * sigmoid_derivative(self.output), self.weights2.T) * sigmoid_derivative(self.layer1)))
# update the weights with the derivative (slope) of the loss function
self.weights1 += d_weights1
self.weights2 += d_weights2
if __name__ == "__main__":
X = np.array([[0,0,1],
[0,1,1],
[1,0,1],
[1,1,1]])
y = np.array([[0],[1],[1],[0]])
nn = NeuralNetwork(X,y)
for i in range(1500):
nn.feedforward()
nn.backprop()
print(nn.output)
Проблема в в функции прямого распространения feedforward(self)
:
def feedforward(self):
self.layer1 = sigmoid(np.dot(self.input, self.weights1))
self.output = sigmoid(np.dot(self.layer1, self.weights2))
Первая строка из входа X
линейно комбинируется с весами только первого нейрона в скрытом слое в self.layer1 = sigmoid(np.dot(self.input, self.weights1))
, поэтому self.layer1[0]
- это линейная комбинация весов первого нейрона и первой строки входа.
Вторая строка из входа X
линейно комбинируется с весами только второго нейрона в скрытый слой в self.layer1 = sigmoid(np.dot(self.input, self.weights1))
, поэтому self.layer1[1]
- это линейная комбинация весов второго нейрона и второй строки ввода.
Итак:
self.layer[0] = X[0] * Weights_of_first_neuron
self.layer[1] = X[1] * Weights_of_second_neuron
Et c.
Вопрос:
Разве не должно быть так, что для каждого обучающего набора из ввода X
каждая строка из X
линейно комбинируется с все нейроны в скрытом слое и их соответствующие веса?
S o: для каждого обучающего набора (или ряда) из входа X
:
self.layer[0] = X[current_row] * Weights_of_first_neuron
self.layer[1] = X[current_row] * Weights_of_second_neuron
self.layer[2] = X[current_row] * Weights_of_third_neuron
self.layer[3] = X[current_row] * Weights_of_fourth_neuron