РЕДАКТИРОВАТЬ: ссылка должна работать сейчас, извините за беспокойство
У меня есть текстовый файл, который выглядит так:
Name, Test 1, Test 2, Test 3, Test 4, Test 5
Bob, 86, 83, 86, 80, 23
Alice, 38, 90, 100, 53, 32
Jill, 49, 53, 63, 43, 23.
Я пишу программу, которая предоставляет этот текстовый файл, она сгенерирует таблицу коэффициентов корреляции Пирсона, которая выглядит следующим образом, где запись (x, y) - это корреляция между человеком x и человеком y:
Name,Bob,Alice,Jill
Bob, 1, 0.567088412588577, 0.899798494392584
Alice, 0.567088412588577, 1, 0.812425393004088
Jill, 0.899798494392584, 0.812425393004088, 1
Моя программа работает, за исключением того, что набор данных, который я передаю, имеет 82 столбца и, что более важно, 54000 строк. Когда я запускаю свою программу прямо сейчас, она невероятно медленная, и у меня появляется ошибка нехватки памяти. Есть ли способ, которым я могу прежде всего удалить любую возможность ошибки нехватки памяти и, возможно, заставить программу работать немного эффективнее? Код здесь: код .
Спасибо за вашу помощь,
Jack
Редактировать: Если кто-то еще пытается выполнить крупномасштабные вычисления, преобразуйте ваши данные в формат hdf5. Это то, что я сделал, чтобы решить эту проблему.