Вменять различные типы переменных с MICE - PullRequest
0 голосов
/ 22 апреля 2019

Я пытаюсь выполнить вменение для набора данных, который имеет 69 столбцов и более 50000 строк. Мой набор данных имеет разные типы переменных:

  1. столбцы, которые представляют только двоичные переменные (0,1)
  2. категориальные столбцы
  3. столбцы, которые принимают непрерывные числовые данные

Теперь я хочу выполнить вменение и знаю, что мои столбцы имеют высокий уровень мультиколлинеарности.

Нужно ли разбивать мой набор данных на 3 различных подмножества (по одному для каждого из 1), 2), 3) типа столбца, который у меня может быть), или я должен выполнить вменение для всего набора данных?

Проблема в том, что мыши-компоновщики имеют разные методы для каждого из этих типов. И если я запускаю три разных раза, должен ли я принимать во внимание весь набор данных или только эту конкретную часть?

1 Ответ

1 голос
/ 07 мая 2019

Вы можете сразу ввести весь набор данных мышам. (вы можете указать, какой метод использовать для каждой переменной в отдельности)

Цитирую от мышей ссылку:

Параметр 'method'

Может быть либо одной строкой, либо вектором строк с длиной длины (блоков), определяющих метод вменения, который будет использоваться для каждого столбца в данных. Если указано как одна строка, один и тот же метод будет использоваться для всех блоков. Метод вменения по умолчанию (если аргумент не указан) зависит от уровня измерения целевого столбца, который регулируется аргументом defaultMethod. Столбцы, которые не нужно вменять, имеют пустой метод "". Подробности см.

...