Вставка записей в одну ячейку и удаление пустых ячеек - PullRequest
1 голос
/ 10 января 2020

У меня следующая проблема: у меня есть таблица с множеством пустых ячеек. Но первый столбец не содержит пустых ячеек. Вот так:

structure(list(variable = c("variable", "Mean (M)", "Standard", 
"deviation", "(SD)", "1. Challenge"), M = c("M", "", "", "", 
"", "3.06"), SD = c("SD", "", "", "", "", "1.08"), X1 = c("1", 
"3.03", "1.09", "", "", ""), X2 = c("2", "2.19", "1.07", "", 
"", "â\210’0.06"), X3 = c("3", "1.93", "1.10", "", "", "0.52***"
), X4 = c("4", "1.86", "1.04", "", "", "â\210’0.14*")), row.names = c(NA, 
6L), class = "data.frame"))

Как это выглядит сейчас

Теперь я хотел бы вставить записи двух ячеек в Стандартные (= "отклонение" и " (SD) ") в ячейку и удалите эти строки, содержащие только пустые ячейки. Таким образом, результат должен выглядеть следующим образом:

structure(list(variable = structure(c(2L, 3L, 1L), .Label = c("1. Challenge", 
"Mean (M)", "Standard deviation SD", "variable"), class = "factor"), 
    M = structure(c(1L, 1L, 2L), .Label = c("", "3.06", "M"), class = "factor"), 
    SD = structure(c(1L, 1L, 2L), .Label = c("", "1.08", "SD"
    ), class = "factor"), `1` = structure(c(4L, 3L, 1L), .Label = c("", 
    "1", "1.09", "3.03"), class = "factor"), `2` = structure(c(3L, 
    1L, 4L), .Label = c("1.07", "2", "2.19", "â\210’0.06"), class = "factor"), 
    `3` = structure(3:1, .Label = c("0.52***", "1.10", "1.93", 
    "3"), class = "factor"), `4` = structure(c(2L, 1L, 4L), .Label = c("1.04", 
    "1.86", "4", "â\210’0.14*"), class = "factor")), row.names = 2:4, class = "data.frame")

Как бы я хотел, чтобы это выглядело

Вы можете помочь? Спасибо!

1 Ответ

1 голос
/ 10 января 2020

Один из вариантов - создать столбец группировки на основе наличия пробелов ("") во всех столбцах, кроме первого, а затем paste элементов каждого из столбцов, если количество строк больше 1 и получите distinct строки

library(dplyr)
library(stringr)
df1 %>% 
    group_by(grp = cumsum(rowSums(.[-1] == "") != ncol(.)-1))  %>%  
    mutate_at(vars(-group_cols()), ~ if(n() > 1) str_c(., collapse=" ") else .) %>%
    ungroup %>%
    type.convert(as.is = TRUE) %>%
    select(-grp) %>% 
    distinct
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...