Question

У меня есть набор данных, называемый user_view, который выглядит следующим образом:

В этих данных около 45 миллионов строк.Я должен был распространить его, используя следующий код:

library(tidyverse)
spread_view <- spread(user_view, Seq, Channel)

Когда я запускаю это на подмножестве набора данных, спред работает нормально.Когда я повторяю это по всему набору данных, я начинаю видеть забавные результаты.Цифры выглядят намного больше, и кажется, что они распространяются неправильно.

Кто-нибудь видел это раньше и есть ли альтернативный способ сделать эти данные широкими?

Спасибо!

(извините, форматирование не очень хорошее)

Я пробовал несколько разных решений.Включая удаление конкурирующих пакетов, работающих на подмножествах данных.

Я ожидаю получить это.И он работает на подмножестве штрафа, но при расширении до 45 миллионов строк он портится ...

Пример того, что я в итоге получаю:

Непоследовательные результаты при использовании функции распространения в R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Непоследовательные результаты при использовании функции распространения в R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы