Keras model.predict с сигмоидальной активацией и двоичной кросс-энтропией возвращает только 0 или 1, а не вероятность - PullRequest
1 голос
/ 09 октября 2019

Я строю NN в Керасе с перекрывающимися предсказаниями классов. Из того, что я понимаю, функция активации 'sigmoid' должна возвращать вероятность принадлежности к классу. Однако, когда я пытаюсь использовать model.predict (...), он просто возвращает нули или единицы. Не могли бы вы сказать мне, где я иду не так и как я могу получить вероятность принадлежности к классу?

input_stock = Input(shape=input_shape,dtype='float32')  
stock_data= Conv2D(32, (1,5), padding='same', activation='relu')(input_stock)
stock_data = MaxPooling2D((1,2),strides=(1,2))(stock_data)
stock_data= Conv2D(8, (1,5), padding='same', activation='relu')(stock_data)
stock_data = MaxPooling2D((1,5),strides=(1,5))(stock_data)
stock_data= Conv2D(8, (154,5), padding='same', activation='relu')(stock_data)
stock_data = MaxPooling2D((1,2),strides=(1,2))(stock_data)

stock_data=Flatten()(stock_data)
stock_data=Dropout(.5)(stock_data)
output_layer = Dense(maxnumassets, activation='sigmoid')(stock_data)


model = Model(inputs=input_stock, outputs=output_layer)



return model

Output of model.predict (there are 150 classes), looks like below. 

array([[1., 1., 0., 0., 1., 1., 0., 1., 0., 0., 0., 1., 0., 1., 1., 1.,
        0., 0., 1., 1., 0., 0., 1., 0., 0., 1., 0., 0., 0., 0., 1., 0.,
        0., 1., 0., 0., 1., 1., 1., 1., 0., 1., 1., 0., 0., 0., 0., 1.,
        0., 1., 1., 1., 1., 1., 0., 0., 0., 0., 1., 1., 1., 0., 0., 1.,
        0., 0., 0., 1., 1., 0., 0., 0., 0., 0., 0., 0., 0., 1., 1., 1.,
        1., 1., 0., 0., 1., 1., 1., 0., 0., 0., 1., 0., 1., 0., 0., 0.,
        1., 1., 1., 0., 0., 0., 1., 0., 1., 0., 1., 1., 1., 0., 1., 1.,
        0., 0., 1., 1., 1., 0., 0., 0., 0., 1., 1., 0., 1., 1., 1., 1.,
        0., 0., 0., 1., 1., 0., 0., 0., 1., 0., 1., 0., 1., 0., 1., 1.,
        1., 1., 0., 0., 0., 0.]], dtype=float32)'''

Dimensions of the data are as follows:

train (715, 150, 100, 2)
ytrain (715, 150)
xtest (80, 150, 100, 2)
ytest (80, 150)

1 Ответ

3 голосов
/ 09 октября 2019

Если вы просто используете model.predict(xtest) напрямую, тогда ваш код будет вообще давать значения, отличные от 0 и 1, ср. В приведенном ниже примере ничего не происходит, кроме применения вашей модели к случайным данным.

Если у вас нет, возможно, вы перегружаете или ваша модель просто идеально подходит для ваших данных. Попробуйте применить model.predict к массиву, который не имеет ничего общего с вашими данными.

Еще одна вещь, которая кажется неправильной, это то, что вы даете в своем примере вывод массива (1, 150), но если xtest.shape действительно (80, 150, 100, 2), тогда model.predict(xtest).shape равно (80, 150).

input_shape = (150, 100, 2)
maxnumassets = 150
input_stock = Input(shape=input_shape,dtype='float32')
stock_data = Conv2D(32, (1,5), padding='same', activation='relu')(input_stock)
stock_data = MaxPooling2D((1,2),strides=(1,2))(stock_data)
stock_data = Conv2D(8, (1,5), padding='same', activation='relu')(stock_data)
stock_data = MaxPooling2D((1,5),strides=(1,5))(stock_data)
stock_data = Conv2D(8, (154,5), padding='same', activation='relu')(stock_data)
stock_data = MaxPooling2D((1,2),strides=(1,2))(stock_data)
stock_data = Flatten()(stock_data)
stock_data = Dropout(.5)(stock_data)
output_layer = Dense(maxnumassets, activation='sigmoid')(stock_data)

model = Model(inputs=input_stock, outputs=output_layer)
train = np.random.uniform(size=(775, 150, 100, 2))
ytrain = np.random.uniform(size=(775, 150))
xtest = np.random.uniform(size=(80, 150, 100, 2))
ytest = np.random.uniform(size=(80, 150))

model.compile('adam', 'mse')
model.fit(train, ytrain)
model.predict(xtest)

Выход:

array([[0.50180054, 0.49852884, 0.49954456, ..., 0.4990623 , 0.49985167,
        0.4994816 ],
       [0.50180054, 0.49852884, 0.49954456, ..., 0.4990623 , 0.49985167,
        0.4994816 ],
       [0.50180054, 0.49852884, 0.49954456, ..., 0.4990623 , 0.49985167,
        0.4994816 ],
       ...,
       [0.50180054, 0.49852884, 0.49954456, ..., 0.4990623 , 0.49985167,
        0.4994816 ],
       [0.50180054, 0.49852884, 0.49954456, ..., 0.4990623 , 0.49985167,
        0.4994816 ],
       [0.50180054, 0.49852884, 0.49954456, ..., 0.4990623 , 0.49985167,
        0.4994816 ]], dtype=float32)
...