Чрезвычайно высокая дисперсия нейронной сети - PullRequest
0 голосов
/ 15 октября 2019

Я работаю с tenorflow, чтобы понять, как использовать нейронную сеть. Моя архитектура - 73x100x100x100x2 (у меня 73 входных объекта, и у моего классификатора есть 2 выходных класса. Есть 3 скрытых слоя по 100 нейронов в каждом. У меня есть обучающий набор данных из 20990 примеров. Мой тестовый набор содержит 1227 примеров.

Я выполняю Оптимизацию с помощью Adam-Оптимизатора и мини-пакета. Моя скорость обучения равна 0,001, num_epochs = 501, minibatch_size = 64, L2_beta (для L2-Regularization) = 0,01). Когда я делаю выпадение, я использую keep_prob = 0,7.

Если я использую только NN, я получаю

Точность поезда: 0,9951882 Точность теста: 0,5590872

Если я использую регуляризацию, я получаю

Точность поезда: 0,97122437 Точность теста: 0,57457215

Если я добавляю выпадение (я использую его между скрытыми слоями 1 и 2 кака также между скрытыми слоями 2 и 3) Я получаю

Точность поезда: 0,8223916 Точность теста: 0,591687

Поскольку у меня есть два выходных класса, угадывание даст мне 50% точности.

У вас есть идеи, что еще я мог бы попробовать?

...