Параметризовать запрос в RPostgres и добавлять результаты в новый фрейм данных - PullRequest
1 голос
/ 27 сентября 2019

У меня есть набор парных значений, хранящихся в кадре данных parameters:

parameters <- data.frame(
   variant_id = c(1, 2, 3, 4, 5),
   start_date = c("2019-07-01", "2019-09-05", "2019-05-21", "2019-09-06",
                  "2019-04-19"))

> parameters
  variant_id start_date
1          1 2019-07-01
2          2 2019-09-05
3          3 2019-05-21
4          4 2019-09-06
5          5 2019-04-19

Я хочу использовать эти комбинации variant_id и start_date в качестве динамических параметров в этом запросе SQL, выполняемом вRPostgres.

library(RPostgres)
library(tidyverse)

query <- "select sum(o.quantity)
from orders o
where o.date >= << start_date >>
and o.variant_id = << variant_id >> "

df <- dbGetQuery(db, query)

У меня будут запросы типа:

query_1 <- "select sum(o.quantity)
from orders o
where o.date >= '2019-07-01'
and o.variant_id = 1 "

result_1 <- dbGetQuery(db, query_1)
 > result_1
     sum
   1 100

query_2 <- "select sum(o.quantity)
from orders o
where o.date >= '2019-09-05'
and o.variant_id = 2 "

result_2 <- dbGetQuery(db, query_2)
 > result_2
     sum
   1 120


query_3 <- "select sum(o.quantity)
from orders o
where o.date >= '2019-05-21'
and o.variant_id = 3 "

result_3 <- dbGetQuery(db, query_3)
 > result_3
     sum
   1 140

... и т. Д.

Затем я хотел бы добавить каждый результат вновый фрейм данных results как:

results <- data.frame(
              variant_id = c(1, 2, 3, 4, 5),
                quantity = c(100, 120, 140, 150, 160)
           )

> results
  variant_id quantity
1          1      100
2          2      120
3          3      140
4          4      150
5          5      160

Как я могу решить эту проблему, используя RPostgres и dplyr, избегая использования цикла?

1 Ответ

0 голосов
/ 27 сентября 2019

У нас нет вашей базы данных, но мы использовали parameters и orders, указанные в примечании в конце.Мы добавили stringsAsFactors = FALSE в определение parameters, чтобы обеспечить наличие символьных строк.

Теперь используйте sprintf для создания символьного вектора запросов.Затем запустите каждый.Здесь мы используем sqldf, чтобы сделать все воспроизводимым, поскольку у нас нет вашей базы данных, но вы можете заменить sqldf на соответствующий оператор, чтобы получить результат из вашей базы данных.

query <- "select sum(o.quantity)
  from orders o
  where o.date >= '%s'
  and o.variant_id = %s "

queries <- with(parameters, sprintf(query, start_date, variant_id))

library(sqldf)

# replace sqldf in next line with appropriate function to invoke query
do.call("rbind", lapply(queries, sqldf))
##   sum(o.quantity)
## 1               1
## 2              NA
## 3               3
## 4              NA
## 5              NA

Примечание

# test data

parameters <- data.frame(
   variant_id = c(1, 2, 3, 4, 5),
   start_date = c("2019-07-01", "2019-09-05", "2019-05-21", "2019-09-06",
                  "2019-04-19"), stringsAsFactors = FALSE)

orders <- data.frame(date = "2019-07-02", variant_id = 1:3, quantity = 1:3)
...