У меня есть набор данных, называемый user_view, который выглядит следующим образом:
В этих данных около 45 миллионов строк.Я должен был распространить его, используя следующий код:
library(tidyverse)
spread_view <- spread(user_view, Seq, Channel)
Когда я запускаю это на подмножестве набора данных, спред работает нормально.Когда я повторяю это по всему набору данных, я начинаю видеть забавные результаты.Цифры выглядят намного больше, и кажется, что они распространяются неправильно.
Кто-нибудь видел это раньше и есть ли альтернативный способ сделать эти данные широкими?
Спасибо!
(извините, форматирование не очень хорошее)
Я пробовал несколько разных решений.Включая удаление конкурирующих пакетов, работающих на подмножествах данных.
Я ожидаю получить это.И он работает на подмножестве штрафа, но при расширении до 45 миллионов строк он портится ...
Пример того, что я в итоге получаю: