R - table () возвращает повторяющиеся факторы - PullRequest
0 голосов
/ 01 июня 2018

Я использую опрос FiveThirtyEight's Star Wars.

На $Anakin Я присвоил 0 (очень неблагоприятно) 5 (очень благоприятно) в качестве категориальных переменных для представления респондента об Анакине.«Н / Д» по результатам опроса было присвоено «». (Это был шаг в MS Excel)

$Startrek содержит информацию о том, видел ли респондент Star Trek или нет.

starwars <- read.csv2("starsurvey.csv", header = TRUE, stringsAsFactors = FALSE)
as.factor(starwars$Anakin)
as.factor(starwars$Startrek)
tbl <- table(starwars$Anakin, starwars$Startrek)

Функция table() возвращает это:

       No Yes
1   0  20  19
2   2  31  50
3   0  68  67
4   1 140 128
5   5 101 139

Мне интересно, почему функция возвращает 0, 2, 0, 1, 5 для факторов в $Anakin, поскольку он содержит:

starwars$Anakin
[1] 5    <NA> 4    5    2    5    4    3    4    5    <NA> <NA> 4    4           
[15] 4    2    3    5    5    5    4    3    3    2    5    <NA> 4    4   
[29] 1    1    3    5    2    <NA> <NA> 5    5    4    4    4    3    4   
[43] 4    4    4    4    <NA> 2    3    <NA> 4    4    5    4    4    <NA>

1 Ответ

0 голосов
/ 01 июня 2018

Вывод таблицы здесь сбивает с толку, потому что ваши уровни факторов (от 1 до 5) выглядят как номера строк, и есть некоторые пустые ("") ответы на переменную Startrek, из-за чего кажется, что данные находятся только подСтолбцы «Нет» и «Да».

Таким образом, данные здесь представляют собой таблицу 5 на 3, где строки представляют оценку от Anakin (1 до 5), а столбцы представляют 3 типа ответа на Startrek("", No, Yes).

Обратите внимание, что там, где есть NA в Anakin, эти данные заносятся в таблицу.Чтобы посчитать их тоже, используйте addNA:

table(addNA(starwars$Anakin), starwars$Startrek)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...