У меня проблема, аналогичная той, которую я выложил здесь:
Сравнение двух столбцов: логическое - это значение из столбца 1 также в столбце 2?
Однакоданные представлены в несколько ином формате.Общая структура данных - это список в одном столбце фотографий, снятых за 3-дневный период, и другой столбец фотографий, которые соответствуют фотографиям в столбце 1. Другая информация - это какой день был сделан, так что люди каждого днявзаимоисключающие - не более одной фотографии в день конкретного человека (т. е. «A» никогда не будет соответствовать «B» в моем примере ниже, потому что они оба с 1-го дня).
photo <- c('A','B','C','D','E','F','G','H','I','J','K','K','L')
day <- c(1,1,1,1,2,2,2,3,3,3,3,3,3)
matching_photo <- c(NA,NA,NA,NA,NA,'A','B','E',NA,NA,'F','A','C')
DF <- data.frame(photo,day,matching_photo)
Вывод данных, который я ищу, это:
serial.no <- c(1,2,3,4,5,6)
individuals <- c('A,F,K','B,G','C,L','D','E,H','I')
histories <- c('111','110','101','100','011','001')
finalDF <- data.frame(individuals,histories)
, который включает в себя серийный номер для идентификации личности (составлен, как я иду, так что просто начиная с последовательной серии из 1), список фотографий, которыесоответствуют каждому человеку в столбце и истории.Истории следуют в двоичном формате, так что если вы наблюдались в первый день, а не снова до третьего дня, ваша история была бы «101».Но если бы вас наблюдали только на второй день, ваша история была бы «010».
Одна из проблем, с которыми я сталкиваюсь с этим конкретным набором данных (по сравнению с проблемой, связанной выше), заключается в том, что если человеквиден 3 дня подряд, в столбце фотографий есть две записи для этого человека («K» в моем примере выше), соответствующие фотографиям обоих предыдущих дней («A» и «F»).Я ценю любую помощь, оказанную.Спасибо!