Непоследовательные результаты при использовании функции распространения в R - PullRequest
0 голосов
/ 10 июля 2019

У меня есть набор данных, называемый user_view, который выглядит следующим образом:

user_view

В этих данных около 45 миллионов строк.Я должен был распространить его, используя следующий код:

library(tidyverse)
spread_view <- spread(user_view, Seq, Channel)

Когда я запускаю это на подмножестве набора данных, спред работает нормально.Когда я повторяю это по всему набору данных, я начинаю видеть забавные результаты.Цифры выглядят намного больше, и кажется, что они распространяются неправильно.

Кто-нибудь видел это раньше и есть ли альтернативный способ сделать эти данные широкими?

Спасибо!

(извините, форматирование не очень хорошее)

Я пробовал несколько разных решений.Включая удаление конкурирующих пакетов, работающих на подмножествах данных.

Я ожидаю получить это.И он работает на подмножестве штрафа, но при расширении до 45 миллионов строк он портится ...

enter image description here

Пример того, что я в итоге получаю: enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...