Разделение подзаголовков в одном столбце на несколько столбцов - PullRequest
0 голосов
/ 13 мая 2018

Я хотел бы провести классификацию и регрессионный анализ в системном журнале, который я получил от клиента. Журнал (CSV-файл) содержит журнал за 12 часов в одном столбце с разрывом, содержащим начало следующего измерения. Пример:

Time                Average CPU Utilization
2018/05/11 02:35    0.9006184
2018/05/11 02:40    0.7937351
.
.
.
Time    Frames In /sec
2018/05/11 02:37    32359.08251
2018/05/11 02:40    31141.59141
.
.
.

Существует около 19000 строк с примерно 30-40 подзаголовками. Что было бы быстрым способом разделить каждый разрыв журнала на отдельные заголовки столбцов вместо того, чтобы я копировал и вставлял их вручную рядом друг с другом.

Возможно ли это в R? Или есть другие предложения?

1 Ответ

0 голосов
/ 13 мая 2018

Мы можем прочитать данные с помощью readLines, а затем создать переменную группировки, используя grep и cumsum, split данные, в list данных и прочитать с помощью read.table

i1 <- grepl("Time", lines)
lapply(split(lines, cumsum(i1)), function(x) read.table(text = x[-1], header = FALSE))

Данные

lines <- readLines("file.txt")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...