Как разбить фрейм данных и прикрепить разбитую часть в новый столбец? - PullRequest
3 голосов
/ 19 февраля 2020

Я хочу разделить фрейм данных, изменив значения в первом столбце, а затем присоединить разделенную часть в новый столбец. Пример приведен ниже. Однако я получаю список, который не могу обработать обратно на удобный фрейм данных.

желаемый результат должен выглядеть как df_goal, который еще не отформатирован должным образом.

#data

x <-c(1,2,3)
y <-c(20200101,20200101,20200101)
z <-c(4.5,5,7)
x_name <- "ID"
y_name <- "Date"
z_name <- "value"   

df <-data.frame(x,y,z)
names(df) <- c(x_name,y_name,z_name)

#processing

df$date <-format(as.Date(as.character(df$date), format="%Y%m%d"))
df01 <- split(df, f = df$ID)

#goal
a <-c(1)
b <-c(20200101)
c <-c(4.5)
d <-c(2)
e <-c(20200101)
f <-c(5)
g <-c(3)
h <-c(20200101)
i <-c(7)

df_goal <- data.frame(a,b,c,d,e,f,g,h,i)

Ответы [ 4 ]

3 голосов
/ 19 февраля 2020

Вы можете использовать Reduce и cbind до cbind каждой строки data.frame в одной строке и сохранять тип столбцов.

Reduce(function(x,y) cbind(x, df[y,]), 2:nrow(df), df[1,])
#  ID     Date value ID     Date value ID     Date value
#1  1 20200101   4.5  2 20200101     5  3 20200101     7
#Equivalent for the sample dataset: cbind(cbind(df[1,], df[2,]), df[3,])

или do.call с split:

do.call(cbind, split(df, 1:nrow(df)))
#  1.ID   1.Date 1.value 2.ID   2.Date 2.value 3.ID   3.Date 3.value
#1    1 20200101     4.5    2 20200101       5    3 20200101       7
#Equivalent for the sample dataset: cbind(df[1,], df[2,], df[3,])

Если у вас есть несколько строк на ID , вы можете попробовать:

x <- split(df, df$ID)
y <- max(unlist(lapply(x, nrow)))
do.call(cbind, lapply(x, function(i) i[1:y,]))
1 голос
/ 19 февраля 2020

Один из вариантов может быть:

setNames(Reduce(c, asplit(df, 1)), letters[1:Reduce(`*`, dim(df))])

     a          b          c          d          e          f          g          h          i 
   1.0 20200101.0        4.5        2.0 20200101.0        5.0        3.0 20200101.0        7.0 
1 голос
/ 19 февраля 2020

Это возможное решение для вашего примера:

new_df = data.frame(list(df[1,],df[2,],df[3,]))

И если вы хотите обобщить это для больших данных. Frame:

new_list = list()
for ( i in 1:dim(df)[1] ){
    new_list[[i]] = df[i,]
}
new_df = data.frame(new_list)
0 голосов
/ 19 февраля 2020

Может быть, вы можете попробовать следующий код

df_goal <- data.frame(t(c(t(df))))

такой, что

> df_goal
  X1       X2  X3 X4       X5 X6 X7       X8 X9
1  1 20200101 4.5  2 20200101  5  3 20200101  7
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...