Я не уверен, насколько хорошо это решение в целом, но оно работает в вашем случае.
Во-первых, вы, вероятно, должны обрабатывать заголовок и остальную часть файла отдельно. Вот часть данных.
Считать данные с помощью устройства чтения файлов с фиксированным столбцом pandas read_fwf
, пропустить первые три строки:
import pandas as pd
import numpy as np
data = pd.read_fwf("yourfile", skiprows=2, widths=[20,20,20,20])
Извлеките значения из кадра данных, сгладьте их:
values = data.values.reshape(1,-1)[0]
Удалите пустые ячейки, измените форму до шести столбцов:
values[~np.isnan(values)].reshape(-1,6)