Формула для подсчета информации 2 разных столбцов - PullRequest
0 голосов
/ 06 февраля 2019

У меня есть столбец A с различными названиями областей, скажем, от 1 до 10 (повторяется по всему столбцу, по одному в каждой ячейке).Затем у меня есть столбец B с датами, в которых что-то было сделано в этой конкретной области, в некоторых ячейках еще нет даты, потому что ничего не было сделано.Мне нужно составить резюме, где я подсчитываю, сколько раз что-то было сделано в этой конкретной области.Это значит, что мне нужно взять каждую область (область 1, область 2, область 3 и т. Д.) И посчитать, сколько раз я выполнял действие.Я буду знать, что это было сделано из-за того, что в столбце B есть дата. Мне нужна формула, которая может помочь мне вычислить это.

Ответы [ 2 ]

0 голосов
/ 06 февраля 2019

Если я вас хорошо понимаю:

SELECT area_name, COUNT(action_date) WHERE action_date <> '' GROUP by area_name;
0 голосов
/ 06 февраля 2019

Это то, что вы ищете?

library(tidyverse)

# create sample data
df <- tibble(A=rep(c(1:10),3), B=rep(c(Sys.Date(), NA),15))

df

       A B         
 1     1 2019-02-06
 2     2 NA        
 3     3 2019-02-06
 4     4 NA        
 5     5 2019-02-06
 6     6 NA        
 7     7 2019-02-06
 8     8 NA        
 9     9 2019-02-06
10    10 NA      
...

# grouping and summarising it for column A
df %>%
  mutate(count=ifelse(!is.na(B), 1, 0)) %>%
  group_by(A) %>%
  summarise(count=sum(count,na.rm=T))

       A count
 1     1     3
 2     2     0
 3     3     3
 4     4     0
 5     5     3
 6     6     0
 7     7     3
 8     8     0
 9     9     3
10    10     0
...