Я пытаюсь проанализировать данные с разделителями табуляции, которые были сохранены в виде текстового файла с посторонними данными. Я хотел бы, чтобы это был R data.table / data.frame.
Формат с разделителями табуляции следующий:
A 1092 - 1093 + 1X
B 1093 HRDCPMRFYT
A 1093 + 1094 - 1X
B 1094 BSZSDFJRVF
A 1094 + 1095 + 1X
B 1095 SSTFCLEPVV
...
Есть только два типа строк, A и B. A последовательно имеет 5 столбцов, например, для первого ряда
1092 - 1093 + 1X
B последовательно имеет два столбца:
1093 HRDCPMRFYT
Вопрос: Как вы анализируете файл с «чередующимися» строками разных форматов?
Допустим, это был текстовый файл, который имел только этот формат, чередуя строки A и B, с 5 столбцами и 2 столбцами соответственно. Как вы анализируете это в R data.table? Моя идея, как создать следующий формат:
1092 - 1093 + 1X 1093 HRDCPMRFYT
1093 + 1094 - 1X 1094 BSZSDFJRVF
1094 + 1095 + 1X 1095 SSTFCLEPVV
...