переформатирование данных в несколько столбцов в R - PullRequest
0 голосов
/ 04 августа 2020

Я работаю в R. У меня есть данные, которые в настоящее время находятся в одном длинном столбце, и мне нужно проанализировать их в разных столбцах.

ТЕКУЩИЙ ФОРМАТ (все данные отображаются в одном столбце с именем var1)

var1
585                               00:40:01.530 --> 00:40:03.480
586                     Alex High School: Yeah. Again, Megan.
587                               00:40:05.970 --> 00:40:06.330
588                                  Alex High Five: Megan.
589                               00:40:08.190 --> 00:40:11.520
590 Charlie High School: Know how did with code Daniel go first.
591                               00:40:12.600 --> 00:40:12.810
592                                     Charlie High School: But

ЖЕЛАТЕЛЬНЫЙ ФОРМАТ

585 00:40:01.530 --> 00:40:03.480   Alex High School: Yeah. Again, Megan.
                   
587 00:40:05.970 --> 00:40:06.330 Alex High Five: Megan.
589 00:40:08.190 --> 00:40:11.520 Charlie High School: Know how did with code Daniel go first.
591 00:40:12.600 --> 00:40:12.810 Charlie High School: But

1 Ответ

0 голосов
/ 04 августа 2020

Если мы предположим, что для каждой временной метки есть текст, тогда мы могли бы сделать:

data.frame(matrix(df$var1, nrow(df)/2, byrow=TRUE))

                            X1                                                           X2
1 00:40:01.530 --> 00:40:03.480                        Alex High School: Yeah. Again, Megan.
2 00:40:05.970 --> 00:40:06.330                                       Alex High Five: Megan.
3 00:40:08.190 --> 00:40:11.520 Charlie High School: Know how did with code Daniel go first.
4 00:40:12.600 --> 00:40:12.810                                     Charlie High School: But

Если это не так, тогда вам придется изменить форму данных:

 reshape(transform(df, id = id <-cumsum(grepl("-->",df$var1)), time= ave(id, id, FUN = seq)), v.names="var1", dir="wide")
  id                        var1.1                                                       var1.2
1  1 00:40:01.530 --> 00:40:03.480                        Alex High School: Yeah. Again, Megan.
3  2 00:40:05.970 --> 00:40:06.330                                       Alex High Five: Megan.
5  3 00:40:08.190 --> 00:40:11.520 Charlie High School: Know how did with code Daniel go first.
7  4 00:40:12.600 --> 00:40:12.810                                     Charlie High School: But
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...