У меня есть данные о землетрясении, которые я хочу прочитать в кадре данных Pandas. Данные для каждого землетрясения распределены по 5 строкам фиксированного формата, а формат для каждой из 5 линий различен. Некоторые поля содержат переменные пробелы, поэтому я не могу просто читать с разделителями.
Есть ли элегантный способ разобрать это с помощью read_fwf (или чего-то еще)? Я думаю, что вложенные циклы с chunksize = 1 могут работать, но они не очень чистые. Или я мог бы переформатировать файл так, чтобы каждый 5-строчный блок выводился в одну строку; но я бы лучше использовал оригинальный файл.
Вот он, первое землетрясение в качестве примера:
MLI 1976/01/01 01:29:39.6 -28.61 -177.64 59.0 6.2 0.0 KERMADEC ISLANDS REGION
M010176A B: 0 0 0 S: 0 0 0 M: 12 30 135 CMT: 1 BOXHD: 9.4
CENTROID: 13.8 0.2 -29.25 0.02 -176.96 0.01 47.8 0.6 FREE O-00000000000000
26 7.680 0.090 0.090 0.060 -7.770 0.070 1.390 0.160 4.520 0.160 -3.260 0.060
V10 8.940 75 283 1.260 2 19 -10.190 15 110 9.560 202 30 93 18 60 88