Я пытаюсь создать цикл в R, который вычисляет все возможные комбинации всех 20 аминокислот без повторения в строках длиной до 20 символов:
S <- c('G','A','L','M','F','W','K','Q','E','S','P','V','I','C','Y','H','R','N','D','T')
allCombs <- function(x) c(x, lapply(seq_along(x)[-1L],
function(y) combn(x, y, paste0, collapse = "")),
recursive = TRUE)
fu <- allCombs(S)
Этот код делает это, но у меня также есть dataframe / csv, который содержит относительные пропорции аминокислот для 1000 различных видов, например:
Species G A L ...
Species 1 0.1 0.2 0.4
Species 2 0.1 0.02 0.2
Species 3 0.0 0.09 0.01
То, что я пытаюсь сделать, - это вычислить, какова доля каждой другой комбинации аминокислот (G, A, L и т. Д.) В целом, т.е. 1, в виде вектора / списка / массива.
Причина, по которой я делаю это в R (а не в python), заключается в том, что я хочу в дальнейшем взаимодействовать с другими факторами (для которых R лучше подходит)
Извиняюсь за то, что неясно, мне трудно объяснить, пожалуйста, дайте мне знать, если я могу быть более ясным, спасибо!