Я работаю над интерпретацией и созданием фрейма данных аналогичного заголовка.Но не знаю, как это сделать, чтобы обрабатывать разные заголовки в каждой строке.
У меня большой текстовый файл, например, abcde.txt
Формат данных, представленных в файле, выглядит следующим образом: (Значение второго столбца говорит об остальном формате, а имя заголовка отличается для разных типов столбца № 2.)
DATA, 0 , timestamp, (set of 5 numbers(A,B,C,D,E) data repeated multiple times.)
DATA,1 timestamp (set of 4 numbers (AA, BB,CC,DD) repeated multiple times)
DATA,2, timestamp (set of 3 numbers (AAA, BBB,CCC) repeated multiple times)
DATA, 3 , timestamp (set of 6 numbers repeated multiple times ))
Значение столбца № 2 достигает максимального значения 5. И файлы имеют несколько строк одинаковых типов столбцов.
Пример:
DATA, 0, A1,B1, C1,D1,E1, A2, B2,C2,D2,E2, A3,B3,C3,D3,D3…
DATA, 1, AA1, BB1,CC1, DD1, AA2, BB2, CC2, DD2, AA3, BB3, CC3, DD3 ….
DATA, 2, AAA1, BBB2,CCC2, AAA1, BBB2,CCC2, AAA1, BBB2,CCC2, AAA1, BBB2,CCC2
DATA, 0, A4,B4, C4,D4,E4, A5, B5,C5,D5,E5, A6,B6,C6,D6,E6…
:::::
Редактировать:
Я попытаюсь немного подробнее объяснить вопрос
Поэтому я хочу сделать отдельные кадры данных для анализа на основезначение второго столбца, которое может быть от 0 до 5.
Если вы видите в примере, второй столбец имеет значение == 0 (строка # 1), это формат заголовка 5, поэтому я хочу подготовить 5 значений исоздайте строку во фрейме данных и прочитайте следующие 5 наборов значений в той же строке и вставьте строку в фрейм данных с повторной отметкой времени.Таким образом, если 10-кратное повторение набора значений 5, это будет кадр данных измерения 10X (5 + 1 (для временной метки)).И я должен повторить это для всех строк, где второй столбец имел значение == 0, и добавить его во фрейм данных, чтобы создать полный фрейм данных второго столбца == 0.
Something like this: (this is the data frame where second column value ==0)
Header: timestamp A B C D E
12345 A1 B1 C1 D1 E1
12345 A2 B2 C2 D2 E2
12345 A3 B3 C3 D3 E3
(new line in file) 14567 A4 B4 C4 D4 E4
14567 A5 B5 C5 D5 E5
14567 A6 B6 C6 D6 E6
…….
Same with second column value==1 and so on.
I am referring data frame as 2D array.