Как оценить / улучшить точность прогноза по нейронной сети с несбалансированным набором данных? - PullRequest
0 голосов
/ 12 мая 2019

Я использовал gridsearchcv, чтобы определить, какие гиперпараметры в классификаторе mlp могут повысить точность из моей нейронной сети.Я выяснил, что количество слоев и узлов имеет значение, но я пытаюсь выяснить, какие другие конфигурации могут иметь значение в точности (на самом деле оценка F1).Но, судя по моему опыту, такие параметры, как «активация», «обучение и скорость», «решатель», ничего не меняют.Мне нужно провести исследование, в котором другие гиперпараметры могут отличать точность от прогнозов через нейронную сеть.

Есть ли у кого-нибудь какие-нибудь советы / идеи о том, какие параметры отличаются от количества слоев / узлов, которые могут повлиять на точность моих прогнозов нейронной сети?

1 Ответ

1 голос
/ 12 мая 2019

Все зависит от вашего набора данных.Нейронные сети не являются волшебными инструментами, которые могут изучать все, а также они требуют много данных по сравнению с традиционными моделями машинного обучения.В случае MLP делать чрезвычайно сложную модель, добавляя много слоев, никогда не будет хорошей идеей, поскольку она делает модель более сложной, медленной и может также привести к переоснащению.Скорость обучения является важным фактором, поскольку она используется для поиска наилучшего решения для модели.Модель делает ошибки и учится на ней, а скорость обучения контролируется скоростью обучения.Если скорость обучения слишком мала, вашей модели потребуется много времени, чтобы достичь наилучшей возможной стадии, но если она слишком высока, модель может просто пропустить лучшую стадию.Выбор функции активации снова зависит от варианта использования и данных, но для более простых наборов данных функция активации не будет сильно отличаться.

В традиционных моделях глубокого обучения нейронная сеть состоит из нескольких уровнейкоторый не всегда может быть плотным.Все слои в МЛП как плотные, т.е. с подачей вперед.Чтобы улучшить свою модель, вы можете попробовать комбинацию плотных слоев наряду с cnn, rnn, lstm, gru или другими слоями.Какой слой использовать, полностью зависит от вашего набора данных.Если вы используете очень простой набор данных для школьного проекта, поэкспериментируйте с традиционными методами машинного обучения, такими как случайный лес, поскольку вы можете получить лучшие результаты.

Если вы хотите придерживаться нейронных сетей, прочитайте о других типахслои, отсев, упорядочение, объединение и т. д.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...