где я могу найти полный пример использования пакета MLR в R - PullRequest
0 голосов
/ 12 марта 2019

Я только изучаю пакет mlr, R. Но весь учебник, который я могу найти, фокусируется на использовании каждой отдельной функции.Я надеюсь, что смогу найти исчерпывающий пример, включающий все этапы моделирования.

Допустим, есть данные:

mydata <- data.frame(type=c('a','a','b','b','c','d','d','d','e','a',
                            'a','c','b','e','a','d','w','t','r','a',
                            'b','c','d','w','q','f','d','s','r','r'),
                     value=c(1,2,1,2,1,3,1,2,3,4,
                             5,6,2,4,2,6,7,8,5,3,
                             1,5,6,2,8,6,3,4,6,3),
                     target=c('y','y','n','n','n','n','n','n','n','n',
                              'n','n','n','n','n','n','n','n','n','y',
                              'n','n','n','n','n','n','n','n','y','n'))

Вы можете видеть, что это несбалансированные данные.В целевом поле есть только 4 строки, обозначенные 'y', в то время как все остальные 26 строк имеют 'n'.Для задачи классификации, все шаги должны быть:

  1. перевод поля 'type' в фиктивные значения
  2. разбить данные на две части: обучение и тестирование
  3. передискретизируйте данные так, чтобы объем данных с целевым значением 'y' был аналогичен количеству данных с целевым значением 'n'.
  4. установите наборы гиперпараметров для случайного леса и xgboost соответственно.
  5. обучите две модели с использованием перекрестной проверки, скажем, k кратно 5.
  6. сравните все результаты, чтобы выбрать лучшую модель и лучший параметр.
  7. визуализируйте результат.

Обычно это нормальный процесс построения модели.Теперь у меня есть только создание фиктивных значений:

a <- mydata %>%
  select(-target) %>%
  createDummyFeatures(method = '1-of-n') %>%   
  mutate(target=mydata$target) 

Я не знаю, как создать полную модель, используя mlr.Может ли кто-нибудь помочь мне с предоставлением всех деталей?

1 Ответ

1 голос
/ 14 марта 2019

Здесь вы можете найти вариант использования регрессии: https://mlr.mlr -org.com / article / tutorial / usecase_regression.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...