Мой друг должен прочитать много данных (около 18000 наборов данных), которые все отформатированы досадно.В частности, предполагается, что данные состоят из 8 столбцов и ~ 8000 строк данных, но вместо этого данные доставляются в виде столбцов из 7, при этом последняя запись выливается в первый столбец следующей строки.
Кроме того, каждый ~30 строк есть только 4 столбца.Это связано с тем, что какая-то восходящая программа преобразует массив 200 x 280 в массив 7x8120.
У меня такой вопрос: как мы можем прочитать данные в массив 8x7000.Мой обычный арсенал np.loadtxt и np.genfromtxt терпит неудачу, когда количество столбцов неравномерно.
Имейте в виду, что производительность является фактором, поскольку это должно быть сделано для ~ 18000 файлов данных.
Вот ссылка на типичный файл данных: http://users -phys.au.dk / hha07 / hk_L1.ref