Я тестирую несколько моделей и хочу создать выходную строку из всех возможных комбинаций входной строки, если буквы не повторяются.Как пример:
inputdata <- c("A1", "A2", "A3", "B1", "B2", "B3", "C1", "C2", "C3")
Вывод будет выглядеть так:
outputdata <- c("A1 + B1 + C1", "A2 + B1 + C1","A3 + B1 + C1", "A1 + B2 + C1", "A1 + B3 + C1", "A1 + B1 + C2", "A1 + B1 + C3", "A2 + B2 + C1", "A2 + B2 + C2", "A3 + B2 + C2", "A3 + B3 + C2", "A3 + B3 + C3")
Я получил большую часть пути через этот код:
library(gtools)
dataformodel <- data.frame(combinations(9,3,inputdata))
dataformodel$x <- apply( dataformodel[, ] , 1 , paste , collapse = "+" )
dataformodel <- dataformodel[, -c(1:3)]
Проблема здесь в том, что одни и те же буквы повторяются, например."A1 + A2 + B1"
- моя мысль заключалась в том, чтобы подсчитывать уникальные буквы в каждой строке и удалять, где count <3 ..., но безуспешно (используя пакет stingr).Есть предложения? </p>