Различная интерпретация данных в Python на основе значения второго столбца - PullRequest
0 голосов
/ 31 мая 2018

Я работаю над интерпретацией и созданием фрейма данных аналогичного заголовка.Но не знаю, как это сделать, чтобы обрабатывать разные заголовки в каждой строке.

У меня большой текстовый файл, например, abcde.txt

Формат данных, представленных в файле, выглядит следующим образом: (Значение второго столбца говорит об остальном формате, а имя заголовка отличается для разных типов столбца № 2.)

DATA, 0 , timestamp, (set of 5 numbers(A,B,C,D,E) data repeated multiple times.)
DATA,1 timestamp (set of 4 numbers (AA, BB,CC,DD) repeated  multiple times)
DATA,2, timestamp (set of 3 numbers (AAA, BBB,CCC) repeated multiple times)
DATA, 3 , timestamp (set of 6 numbers repeated multiple times ))

Значение столбца № 2 достигает максимального значения 5. И файлы имеют несколько строк одинаковых типов столбцов.

Пример:

DATA, 0, A1,B1, C1,D1,E1, A2, B2,C2,D2,E2, A3,B3,C3,D3,D3…
DATA, 1, AA1, BB1,CC1, DD1, AA2, BB2, CC2, DD2, AA3, BB3, CC3, DD3 ….
DATA, 2, AAA1, BBB2,CCC2, AAA1, BBB2,CCC2, AAA1, BBB2,CCC2, AAA1, BBB2,CCC2
DATA, 0, A4,B4, C4,D4,E4, A5, B5,C5,D5,E5, A6,B6,C6,D6,E6…

:::::

Редактировать:

Я попытаюсь немного подробнее объяснить вопрос

Поэтому я хочу сделать отдельные кадры данных для анализа на основезначение второго столбца, которое может быть от 0 до 5.

Если вы видите в примере, второй столбец имеет значение == 0 (строка # 1), это формат заголовка 5, поэтому я хочу подготовить 5 значений исоздайте строку во фрейме данных и прочитайте следующие 5 наборов значений в той же строке и вставьте строку в фрейм данных с повторной отметкой времени.Таким образом, если 10-кратное повторение набора значений 5, это будет кадр данных измерения 10X (5 + 1 (для временной метки)).И я должен повторить это для всех строк, где второй столбец имел значение == 0, и добавить его во фрейм данных, чтобы создать полный фрейм данных второго столбца == 0.

 Something like this: (this is the data frame where second column value ==0)
Header:             timestamp      A    B   C    D    E 
                    12345          A1   B1  C1   D1   E1
                    12345          A2   B2  C2   D2   E2
                    12345          A3   B3  C3   D3   E3
(new line in file)  14567          A4   B4  C4   D4   E4
                    14567          A5   B5  C5   D5   E5
                    14567          A6   B6  C6   D6   E6
…….
Same with second column value==1 and so on.
I am referring data frame as 2D array.
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...