У меня есть набор данных пользователей, которые пытаются решить математические задачи. Им случайным образом дают подсказку (и) для решения проблемы (hint.flag). Я хочу узнать, как скоро пользователь получит «правильный» ответ (правильность) для каждой проблемы, увидев подсказку FIRST в проблеме. Для начала мне нужно было бы создать какой-то индекс, чтобы определить, на какую попытку пост-подсказки они идут.
data.input <- read_table2("user.id problem.id correctness hint.flag
540995 A FALSE 1
540995 A FALSE 0
540995 A FALSE 1
540995 B FALSE 1
540995 B FALSE 1
540995 B TRUE 0
540995 C FALSE 1
540995 C FALSE 1
540995 C TRUE 0
540995 D TRUE 0
565662 A TRUE 0
565662 A FALSE 1
565662 A FALSE 0
565662 A FALSE 1
565662 A FALSE 1
565662 A FALSE 0
565662 A FALSE 0
565662 A FALSE 0")
Столбец, который я пытаюсь вписать, это "post.hint.attempt" (см. Требуемый. Выход).
desired.output <- read_table2("user.id problem.id correctness hint.flag post.hint.attempt
540995 A FALSE 1
540995 A FALSE 0 first
540995 A FALSE 1 second
540995 B FALSE 1
540995 B FALSE 1 first
540995 B TRUE 0 second
540995 C FALSE 1
540995 C FALSE 1 first
540995 C TRUE 0 second
540995 D TRUE 0
565662 A TRUE 0
565662 A FALSE 1
565662 A FALSE 0 first
565662 A FALSE 1 second
565662 A FALSE 1 third
565662 A FALSE 0 fourth
565662 A FALSE 0 fifth
565662 A FALSE 0 sixth
")
Я понятия не имею, как даже начать находить это ... Я думаю, что row_id может быть полезен, но необходимость запаздывать номер попытки при появлении подсказки сбивает меня с толку. Любая помощь будет потрясающей !!!