В этом:
x - это вектор данных, который вы хотите превратить в фактор, в этом случае ответы x=df$response
Levels - это вектор значений, которые x может взяли. По умолчанию это список различных значений x в порядке в порядке возрастания (цифра c или в алфавитном порядке), поэтому значением по умолчанию будет c(0, 1)
. Вам не нужно включать уровни, поскольку они будут автоматически обнаруживать их, однако, когда вы добавляете метки, рекомендуется добавлять уровни, чтобы ваши метки совпали в случае, если у вас много уровней и вы можете получить заказ перепутано.
Метки могут быть либо одной строкой, либо вектором всех меток для уровней, вы можете использовать метки для сопоставления нескольких значений одной и той же метке. Для вашей задачи вы бы использовали c("No", "Yes")
. по умолчанию для меток используются уровни, т.е. нет меток.
Таким образом, ваш окончательный код будет
dfr$response <- factor(x=dfr$response, levels=c(0,1), labels=c("No", "Yes"))
В качестве незначительного отступления люди обычно используют df для представления фрейм данных, а не dfr. Это не имеет никакого значения, это просто общепринятая запись.