Как я могу l oop через список предикторов, используя пакет Synth () в R - PullRequest
0 голосов
/ 17 апреля 2020

Я использую пакет 'Synth' в R (см. ftp: //cran.r-project.org/pub/R/web/packages/Synth/Synth.pdf) и я ' Я хотел бы выяснить, как запустить все возможные комбинации моих предикторов. Я использовал очень полезные предыдущие 'Synth' l oop questions here (циклические переменные результата) и here (сохранение циклов в списке), но ни один из них полностью не помог вопрос, и я все еще чувствую себя застрявшим.

Я собираюсь использовать предыдущий набор игрушечных данных из с циклическими переменными результата для простоты:

all_data_uk <- structure(list(countryno = c(1, 1, 1, 2, 2, 2, 3, 3, 3, 16, 16, 16), country = c("Australia", "Australia", "Australia", "Canada", "Canada", "Canada", "Denmark", "Denmark", "Denmark", "United Kingdom", "United Kingdom", "United Kingdom"), year = c(1971, 1972, 1973, 1971, 1972, 1973, 1971, 1972, 1973, 1971, 1972, 1973), top10_income_share = c(0.2657, 0.2627, 0.2546, 0.37833, 0.37807, 0.37271, 0.323069660453, 0.322700285165, 0.320162826601, 0.2929, 0.289, 0.2831), top5_income_share = c(0.1655, 0.1654, 0.1593, 0.24075, 0.24106, 0.23917, 0.211599113574, 0.21160700537, 0.209096813051, 0.1881, 0.1848, 0.1818), top1_income_share = c(0.0557, 0.0573, 0.054, 0.08866, 0.08916, 0.08982, 0.082392548404, 0.0824267594074, 0.07776546085945, 0.0702, 0.0694, 0.0699), gdp_growth =     structure(c(4.00330835508684,3.91178191457604, 2.59931282534502, 4.11765761702448,5.44585557970514, 6.96420291945871, 3.00503299618597, 3.92934382503836,4.09292523611968, 3.48436803631409, 4.30194591910262,6.50872079327365), label ="(annual %)", class = c("labelled", "numeric")), capital_quinn = structure(c(50, 37.5, 37.5,87.5, 87.5, 75, 75, 75, 75, 50, 50, 50), label = (financial openness - capital     account)", class = c("labelled", "numeric"))), class = "data.frame", .Names = c("countryno", "country", "year", "top10_income_share", "top5_income_share", "top1_income_share", "gdp_growth", "capital_quinn"), row.names = c(NA, -12L))

Использование ' Synth 'dataprep, вот вывод:

control_units_top10 <- c(1,2)
treated_unit <- 16

# Run dataprep() which returns a list of matrices
dataprep.out_top10 <- dataprep(
  foo = all_data_uk,
  predictors = c("gdp_growth", "capital_quinn"),
  predictors.op = "mean", 
  time.predictors.prior = 1971:1972,
  special.predictors = list(
    list("top10_income_share", 1971, "mean"),
    list("top10_income_share", 1972, "mean")),
  dependent = "top10_income_share",
  unit.variable = "countryno",
  unit.names.variable = "country",
  time.variable = "year",
  treatment.identifier = treated_unit,
  controls.identifier = control_units_top10,
  time.optimize.ssr = 1971:1972,
  time.plot = 1971:1973)

# Run synth() command
synth.out_top10 <- synth(data.prep.obj = dataprep.out_top10, optimxmethod = "BFGS")

Я хотел бы создать al oop так, чтобы каждая итерация предикторов (1) "gdp_growth", (2) "capital_quinn" и ( 3) «gdp_growth» И «capital_quinn» запускаются и сохраняются в списке, поэтому я могу сравнить MSPE с оптимизацией по весам v и w («loss.v», «loss.w»). Другими словами:

predictors = c("gdp_growth")
predictors = c("capital_quinn")
predictors = c("gdp_growth", "capital_quinn")

В действительности у меня есть пять предикторов, поэтому мне нужен более эффективный способ запуска комбинаций предикторов.

1 Ответ

0 голосов
/ 19 апреля 2020

Если вы хотите создать комбинацию предиктора, вы можете использовать этот синтаксис expand.grid() .. поэтому, например, у меня есть 2 Vector, содержащие, ID и имя продукта, здесь я могу сделать комбинацию этих двух с этими:

vec1 = c(1,4,7)
vec2 = c("ProdA", "ProdB", "ProdC")
expand.grid(vec1, vec2)
Var1  Var2
1    1 ProdA
2    4 ProdA
3    7 ProdA
4    1 ProdB
5    4 ProdB
6    7 ProdB
7    1 ProdC
8    4 ProdC
9    7 ProdC
combination = expand.grid(vec1, vec2)
combination$combined = paste0(combination$Var2, combination$Var1)
combination
  Var1  Var2 combined
1    1 ProdA   ProdA1
2    4 ProdA   ProdA4
3    7 ProdA   ProdA7
4    1 ProdB   ProdB1
5    4 ProdB   ProdB4
6    7 ProdB   ProdB7
7    1 ProdC   ProdC1
8    4 ProdC   ProdC4
9    7 ProdC   ProdC7
...