Я пытаюсь работать с PyTables
и NumPy
.
Подскажите, пожалуйста, сколько данных может обработать последняя?
В настоящее время я работаю с данными из 140 миллионов строк и хотел бы знать, может ли NumPy
справиться с этим. Было бы неплохо, если бы он мог обрабатывать как минимум 140 миллионов строк из 2 столбцов. Сейчас я использую 64-битную версию Windows с 8 ГБ оперативной памяти.
Если NumPy
не может обработать этот объем данных, каковы возможные альтернативы для алгоритмической реализации статистики и машинного обучения?