Мне нужно создать таблицу когортного анализа, которая выглядит примерно так: Окончательная форма
И у меня есть данные следующего вида:
Каждая строка представляет уникальный идентификатор.У меня проблемы с написанием кода, который будет отображать изменения чисел от 0 до 1 или 2, а затем обратно до 0 в той же конкретной строке.Столбцы месяца в итоговой таблице должны содержать общую сумму всех слайдов всех определенных строк / идентификаторов за один месяц к другому.Эти слайды могут быть от 0 до 1 или 2, а затем вернуться в последующие месяцы.Все НС в данных должны игнорироваться.Должны быть приняты только NA данных после публикации, так как это когда новый пользователь пришел. Я уже рассчитал значения для всех новых пользователей, но не могу получить общее количество слайдов в месяц от 0 до 1 или 2 и обратнодо 1 или 0 за каждый месяц.
Таблица окончательной формы - это то, как должны выглядеть данные.Например, в столбце M2 7 строк сместились к значению 1 в строке M1.Строка M1 показывает кумулятивные изменения, т. Е. Если есть изменение в любом из 1156 значений от 0 до 1 или 2, а затем снова до 1 или 0, то это изменение должно отражаться в значениях столбца той же строки.Например, столбец M3 в строке M1 показывает, что есть 2 значения, которые превратились в значения 1 или 2. (Это может быть из того же идентификатора, отраженного в столбце M2, или из совершенно новых. Из 7 более ранних 5 значений могливернулись к 0, без новых идентификаторов, изменив значение с 0.)