Нейронная сеть в классификации для сравнительно большого набора данных - PullRequest
0 голосов
/ 08 июля 2019

Я пытаюсь выполнить нейронную сеть, используя каретку для задачи классификации.Мой набор данных содержит 94000 строк и 5 переменных (1 двоичная зависимая переменная и 4 независимые переменные).Я очистил данные и преобразовал необходимые переменные.Отсутствуют отсутствующие данные.Данные сбалансированы.Я использую nnet с помощью каретки для перекрестной проверки.Теперь я использую код ниже:

model <- train(Output ~ Var1 + Var2 + Var3 + Var4, 
                          method = "nnet", 
                          data = my_data, verbose = FALSE, 
                          trControl=trainControl(method='repeatedcv', 
                                                 number = 10, 
                                                 repeats = 5,
                                                 verboseIter=FALSE), 
                          tuneGrid=expand.grid(.size=c(0,1,2,5,10,15), 
                                               .decay=c(0,0.001,0.01,0.1)))

Подскажите, пожалуйста, как мне улучшить свою модель?

Дополнительные сведения: 1. Данные представляют собой данные финансового рынка.2. Я буду проверять лучшее пороговое значение, используя индекс Юдена после прогноза.Таким образом, я выберу наилучшее пороговое значение только для отчетов.

Поскольку я новичок в Neural Network, я ищу предложения по улучшению модели с использованием R и того, какую настройку или другую модель я могу использовать.

1 Ответ

0 голосов
/ 25 июля 2019

Видимо, ваш вопрос довольно широкий. Вот некоторые идеи и наблюдения, которые приходят мне в голову, когда я читаю код, и дополнительные подробности, которые вы опубликовали.

  1. Я думаю, что бессмысленно оценивать нулевые значения для нейронных уменьшение размера и веса сети.
  2. Учитывая вышеизложенное, вы можете улучшить свою модель, увеличив размер сетки, в основном для размера нейронной сети.

Комментирование того, что вы используете данные финансового рынка, не добавляет дополнительной информации для читателя. Вы используете временные ряды? Какие переменные вы рассматриваете? Вы рассматриваете проблему как регресс или классификацию?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...