Хорошо известно [1] [2], что numpy.loadtxt не особенно быстро загружает простые текстовые файлы, содержащие числа.
Я искал альтернативные варианты и, конечно же, наткнулся на pandas.read_csv и astropy io.ascii. Тем не менее, эти читатели, кажется, не легко отделить от своей библиотеки, и я хотел бы не добавлять 200 МБ гориллы с 5-секундным временем импорта только для чтения некоторых файлов ascii.
Файлы, которые я обычно читаю, простые, без пропущенных данных, без искаженных строк, без NaN, только с плавающей запятой, через пробел или запятую. Но мне нужны массивы в виде вывода.
Кто-нибудь знает, может ли какой-либо из приведенных выше анализаторов использоваться автономно или о любом другом быстром анализаторе, который я мог бы использовать?
Заранее спасибо.
[1] Загрузка NumPy csv СЛИШКОМ медленная по сравнению с Matlab
[2] http://wesmckinney.com/blog/a-new-high-performance-memory-efficient-file-parser-engine-for-pandas/
[Редактировать 1]
Для ясности и уменьшения фонового шума: как я уже говорил в начале, мои файлы ascii содержат простые числа, нет научной нотации, нет данных на фортране, нет ничего смешного, нет ничего, кроме простых чисел .
Пример:
{
arr = np.random.rand(1000,100)
np.savetxt('float.csv',arr)
}