Я хочу использовать Python для разбора кадра данных из файла (для тех, кто мог бы использовать его входной / входной файл модели SWMM).Заголовок файла печатается довольно уникальным способом, что затрудняет его полный анализ.Пример кадра данных с проблемным заголовком) Я пытаюсь прочитать из файла:
;; Param
;;Node Parameter Time Series Type
;;-------------- ---------------- ---------------- --------
80408 FLOW 80408 FLOW
81009 FLOW 81009 FLOW
82309 FLOW 82309 FLOW
Заголовки не разделены табуляцией или каким-либо фиксированным числом пробелов.Кроме того, для некоторых заголовков, когда их длина слишком велика, они занимают две вертикальные линии, в то время как другие заголовки используют только одну строку.Ширина также не фиксирована, таких фреймов данных несколько, и все они различаются по ширине.
Все, что мне удалось сделать, - это взять самую нижнюю строку в качестве заголовка.
with open(inp_fname, 'r') as f:
for line in f:
headers = re.split("\s{2,}", line.replace(';',"").strip())