добавление новых столбцов в data.table внутри функции в R - PullRequest
1 голос
/ 16 апреля 2020

как часть большей функции, мне нужно создать два новых столбца в data.table (который позже используется для создания графика).

это имена моих столбцов:

names(freqSevDataAge)
 [1] "ag5"                           "claims"              "exposure"               
 [7] "severity"             "frequency" 

Я пытаюсь заставить эту часть функции работать:

  testDT <- function(data, xvar, yvar, yvarsec, groupvar, ...){

  freqSevDataAge2 <- freqSevDataAge[!claims == 0][, ':=' (scaled = "yvarsec" * max("yvar")/max("yvarsec"),
                                                          param  = max("yvar")/max("yvarsec"))]
  }

  testDT(freqSevDataAge, xvar = "ag5", yvar = "severity", yvarsec = "frequency", groupvar = "gender")

ошибка, которую я получаю:

Ошибка в "yvarse c" * max ("yvar"): не числовой c аргумент бинарного оператора

РЕДАКТИРОВАТЬ:

Предложенное решение с использованием get() сработало, однако теперь у меня возникают проблемы с использованием столбца недавно созданного в ggplot. Я получаю ошибку:

Ошибка в f (...): объект 'param' не найден

Я проверил функцию шаг за шагом и знаю, что столбец param создано, проблема вызывается в ggplot. Как я могу

getSecPlot <- function(data, xvar, yvar, yvarsec, groupvar, ...){

  if ("agegroup" %in% xvar) xvar <- get("agegroup")

  data <- data[!claims == 0][, ':=' (scaled = get(yvarsec) * max(get(yvar))/max(get(yvarsec)),
                                     param  = max(get(yvar))/max(get(yvarsec)))]

param <- unique(param)

  sec_plot <- ggplot(data, aes_string (x = xvar, group = groupvar)) +
      geom_col(aes_string(y = yvar, fill = groupvar, alpha = 0.5), position = "dodge") +
      geom_line(aes(y = scaled,  color = gender)) +
      scale_y_continuous(sec.axis = sec_axis(~./(param),
                                             name = paste0("average ", yvarsec), labels = function(x) format(x, big.mark = " ", scientific = FALSE))) +
      labs(y = paste0("total ", yvar)) +
      theme_pubclean()
  }

1 Ответ

1 голос
/ 16 апреля 2020

Мы могли бы изменить функцию, удалив кавычки из переменных внутри функции, используя get, чтобы получить значение объекта

library(data.table)
testDT <- function(data, xvar, yvar, yvarsec, groupvar, ...){

   freqSevDataAge[!claims == 0][, ':=' 
    (scaled = get(yvarsec) * max(get(yvar))/max(get(yvarsec)),
                       param  = max(get(yvar))/max(get(yvarsec)))][]
    }


testDT(freqSevDataAge, xvar = "ag5", yvar = "severity", 
             yvarsec = "frequency", groupvar = "gender")
#    ag5 severity frequency gender claims     scaled     param
#1:   3        8         9      M      1  3.7500000 0.4166667
#2:   6        3        24      F      1 10.0000000 0.4166667
#3:   7       10        17      F      1  7.0833333 0.4166667
#4:   8        8         8      M      1  3.3333333 0.4166667
#5:  10       10         1      M      1  0.4166667 0.4166667

Или другой вариант - преобразовать в символ с as.symbol и оцените с помощью eval

данных

set.seed(24)
freqSevDataAge <- data.table(ag5 = 1:10, severity = sample(1:10, 10,
   replace = TRUE), frequency = sample(1:24, 10, replace = TRUE),
   gender = sample(c("M", "F"), 10, replace = TRUE), 
   claims = sample(0:1, 10, replace = TRUE))
...