Как рассчитать проценты для категориальных переменных по предметам? - PullRequest
2 голосов
/ 24 июня 2019

У меня есть вопрос о расчете процента по элементам и временным бинам.Эксперимент такой:

Я провожу эксперимент с отслеживанием глаз.Участникам было предложено описать картины, состоящие из двух областей интересов (AOIs;Я называю их Agent и Patient).Их движения глаз (фиксация на двух AOI) были записаны в то время, когда они планируют свою формулировку.Я разработал набор данных, включающий информацию о времени и AOI, как показано ниже (все время с момента появления изображения было разделено на отдельные временные интервалы, каждый временной интервал 40 мс).

Stimulus   Participant    AOIs         time_bin     
1          M1             agent          1               
1          M1             patient        2               
1          M1             patient        3               
1          M1             agent          4               

...
1          M2             agent          1               
1          M2             agent          2               
1          M2             agent          3              
1          M2             patient        4               
...
1          M3             agent          1               
1          M3             agent          2               
1          M3             agent          3              
1          M3             patient        4
...

2          M1             agent          1               
2          M1             agent          2               
2          M1             patient        3              
2          M1             patient        4

Я хотел бы создать таблицу, содержащую долю одного AOI (например, агента) по каждому стимулу каждого временного бина.Это будет выглядеть так:

Stimulus      time_bin      percentage     
1                1            20%              
1                2            40%               
1                3            55%               
1                4            60%    
...
2                1            30%              
2                2            35%               
2                3            40%               
2                4            45% 

Я рассчитываю процент, потому что я хочу сделать многоуровневый анализ (анализ кривой роста), исследуя взаимосвязь между зависимой переменной agent fixation proportion и независимой переменной time_bin,а также с stimulus в качестве случайного эффекта.

Я надеюсь, что мой вопрос понятен из-за моего ограниченного знания английского языка.

Если у вас есть идея или предложение, это было бы очень полезно 101

1 Ответ

1 голос
/ 24 июня 2019

Используя пакетную экосистему tidyverse, вы можете попробовать:

library(tidyverse)

df %>%
  mutate(percentage = as.integer(AOIs == "agent") ) %>%
  group_by(Stimulus, time_bin) %>%
  summarise(percentage = mean(percentage))

Обратите внимание, что это даст вам коэффициенты в интервале [0, 1]. Вам все еще нужно преобразовать его в процентные значения, умножив на 100 и добавив «%».

...