Выбор Distinct Использование пакета SQLite в R - PullRequest
0 голосов
/ 29 февраля 2020

Мне было поручено выяснить, сколько телепередач у каждой серии?

У меня есть следующие таблицы, из которых можно выбрать:

enter image description here

Пока я получил следующее:

sql <- "select series_name, sum(telecast_id) from telecast group by 
series_name limit 10"
res <- dbSendQuery(con, sql)
df_tc <- dbFetch(res)
print(df_tc)

Однако возвращает слишком много значений.

Есть предложения?

1 Ответ

1 голос
/ 29 февраля 2020

sum возвращает сумму значений в скобках. Итак, вы добавляете идентификаторы телепередач и получаете большие значения. Чтобы определить «сколько», например, «сколько записей», вам нужно использовать count(). Если вы предполагаете, что ни одна запись не имеет идентификатора телепередачи NULL, оставьте имя столбца пустым в скобках. Я также назвал результат ("As n"), но это не обязательно. И зачем ограничивать топ-10? Это не было указано в вопросе, поэтому удалите его.

sql <- "Select series_name, count() As n from telecast group by series_name"

Другие команды выглядят нормально.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...