Слияние твитов по минутам - PullRequest
0 голосов
/ 16 февраля 2020

Возможно ли объединить твиты с интервалом в 5 минут в R?

Сильфон является частью твитов:

data [1:15,]

Tibble : 15 x 2

текст даты

1 2020-01-10 23:59:56 "Подписаться на @washingtonpost Пересечение от @abbyohlheiser для вашего учебника для начинающих fi sh, затем AMA потому что…

2 2020-01-10 23:59:55 «В моем последнем посте по экооптимизму спрашивается« Можем ли мы надеяться »о #ClimateChange в новом году. Вдохновение от @ G…

3 2020-01-10 23:59:47 "@ MSNB C @maddow @washingtonpost @nytimes \ n@CNN @CBSNews @NBCNews \ nAny of y'all думаю, что это может быть, немного я ...

4 2020-01-10 23:59:39 "Может быть, если бы Голштейн сделал все правильно, ему бы не пришлось беспокоиться о том, чтобы получить его ...

5 2020-01-10 23:59:39 ". @ Washingtonpost сообщает, что сегодняшняя акция #FireDrillFriday была \" началом, по словам организаторов, более широкого шага…

6 2020-01-10 23:59:38 "@washingtonpost Вы все армия, хорошо. https://t.co/QZIYk9CTmv"

7 2020-01-10 23:56:29 "@ GeorgeWillard9 @washingtonpost He определенно был поклонником убийства Брауна и ппл с помощью ударов беспилотников. Мн… M10

1028 * 8 Зал. \ N https://t.co/eGUPctNgoK "

9 2020-01-10 23:59:33" \ "'Конгресс давно отказался от своей ответственности, изложенной в Конституции, за принятие жесткого решения. ns w…

10 2020-01-10 23:58:45 "@OneEyeBlackJack @washingtonpost Еще одна RW l ie"

11 2020-01-10 23:59:24 "@chad_dawkins @washingtonpost Ноль фактов"

12 2020-01-10 23:59:19 "Счастливая пятница! \ n \ nFacebook не хочет признавать факты https://t.co/dZykYez3Ty "

13 2020-01-10 23:59:08" Сюрприз, Сюрприз: Расследование Хиллари Клинтон в Министерстве юстиции обанкротилось \ n \ n # CorruptFourthEstate \ n \ n@CNN @ MS…

14 2020-01-10 23:59:06 "@washingtonpost Все это вонючий заговор. Генерал Салями был жертвенным агнцем в планном люке Путина…

15 2020-01-10 23:58:49 "@ ddale8 Вы имеете в виду Руди Джулиани, назначенного эксперта по кибербезопасности Трампа, который не контролирует все это ? \ n \ n…

1 Ответ

0 голосов
/ 17 февраля 2020

Для этого вы можете использовать функцию floor_date из пакета lubridate. Просто укажите минуты. В приведенном ниже примере используется 1 минута, но измените 1 на 5, и вы округлите значение до ближайших 5 минут.

library(dplyr)
library(lubridate)

df1 %>% 
  mutate(date = floor_date(date, unit = "1 minutes")) %>% 
  group_by(date) %>% 
  summarise(text = paste(text, collapse = " "))


# A tibble: 3 x 2
  date                text                                                                                                                
  <dttm>              <chr>                                                                                                               
1 2020-01-10 23:56:00 "@GeorgeWillard9 @washingtonpost He was definitely a fan of killing brown and ppl with drone strikes. Lots of M…"   
2 2020-01-10 23:58:00 "@OneEyeBlackJack @washingtonpost Yet another RW lie @ddale8 You mean Rudy Giuliani, Trump’s appointed cybersecurit~
3 2020-01-10 23:59:00 "Subscribe to @washingtonpost The Intersect by @abbyohlheiser for your fish content primer, then AMA because fis… M~
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...