У меня есть очень неопрятный набор данных, похожий на этот
A tibble: 200000 x 2
ChatData
<chr>
1 Sep 30, 2018 7:12pm
2 Person A
3 Hello
4 Sep 30, 2018 7:11pm
5 Person B
6 Hello there
7 Sep 30, 2018 7:10pm
8 Person A
...
Как вы видите, идут дата, имя человека, комментарий и повторы.
Я работаю над проблемой, и у меня есть очень сложный метод, который добавляет столбец оценки в зависимости от имен и т. Д.
Я хотел бы преобразовать это в нечто вроде
Person A , Person B
Hello NA
NA Hello there
how's you, NA
...
(Дата в виде имени строки или третьего столбца была бы отличной, но не существенной для вопроса)
Оптимально я ищу решение dplyr / tidyverse. Я работаю с большим количеством данных, поэтому не медлительно для циклов и т. Д...
Необработанные данные для работы:
structure(list(ChatData = c("Sep 30, 2018 7:12pm", "Person A", "Hello", "Sep 30, 2018 7:11pm", "Person B", "Hello there")), row.names = c(NA, -6L), class = c("tbl_df", "tbl", "data.frame"))
Если кому-то интересно, я анализирую данные мессенджера Facebook, и это форма, которую вы получаете при загрузке.
Спасибо.