Получение количества строк, сгруппированных по дате - PullRequest
0 голосов
/ 09 мая 2020

У меня есть следующий фрейм данных:

enter image description here

, и я хочу создать гистограмму, отображающую количество твитов (количество строк) в день (столбец created_at). Как я могу сгруппировать числа по дате?

Большое спасибо

Ответы [ 3 ]

3 голосов
/ 09 мая 2020

В одной цепочке методов:

library(tidyverse)
df %>% 
  group_by(date) %>% 
  mutate(tweets_no = n()) %>% 
  ungroup() %>%
  ggplot(., aes(x = date)) + 
  geom_histogram(stat = "count", fill = "blue")

Или просто используя исходные данные:

ggplot(df, aes(x = date)) + 
  geom_histogram(stat = "count", fill = "blue")
3 голосов
/ 09 мая 2020

Мы можем использовать count

library(dplyr)
df %>%
   count(date)

данные

df <- data.frame(date=c("2020/05/07", "2020/05/07", "2020/05/08"), 
             text=c("tweet_a", "tweet_b", "tweet_c"))
2 голосов
/ 09 мая 2020

Размещение изображения данных обычно не является хорошим способом задать вопросы.

Я пытаюсь ответить на ваш вопрос с помощью некоторых образцов данных.

df <- data.frame(date=c("2020/05/07", "2020/05/07", "2020/05/08"), 
                 text=c("tweet_a", "tweet_b", "tweet_c"))
df %>%
  group_by(date) %>%
  summarise(n=n())

дает вам

  date           n
  <fct>      <int>
1 2020/05/07     2
2 2020/05/08     1

Полагаю, это то, что вы ищете?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...