Я использую опрос FiveThirtyEight's Star Wars.
На $Anakin
Я присвоил 0 (очень неблагоприятно) 5 (очень благоприятно) в качестве категориальных переменных для представления респондента об Анакине.«Н / Д» по результатам опроса было присвоено «». (Это был шаг в MS Excel)
$Startrek
содержит информацию о том, видел ли респондент Star Trek или нет.
starwars <- read.csv2("starsurvey.csv", header = TRUE, stringsAsFactors = FALSE)
as.factor(starwars$Anakin)
as.factor(starwars$Startrek)
tbl <- table(starwars$Anakin, starwars$Startrek)
Функция table()
возвращает это:
No Yes
1 0 20 19
2 2 31 50
3 0 68 67
4 1 140 128
5 5 101 139
Мне интересно, почему функция возвращает 0, 2, 0, 1, 5 для факторов в $Anakin
, поскольку он содержит:
starwars$Anakin
[1] 5 <NA> 4 5 2 5 4 3 4 5 <NA> <NA> 4 4
[15] 4 2 3 5 5 5 4 3 3 2 5 <NA> 4 4
[29] 1 1 3 5 2 <NA> <NA> 5 5 4 4 4 3 4
[43] 4 4 4 4 <NA> 2 3 <NA> 4 4 5 4 4 <NA>