Я пытаюсь изучить основы в науке о данных, поэтому я пытаюсь добыть следующий набор данных (csv), используя python.
1003 *https://www.kaggle.com/jessevent/all-crypto-currencies
70 мг файл
Моя настройка
6-ядерный бульдозер AMD
120 ГБ SSD
2ГБ накопитель данных
Ubuntu 12.04 с libvirt KVM / QEMU
Python 3
Python 2.7
Оказалось, что моя установка не может обработать числа, так как мне нужно сохранить в execl формате .xlsx, и я не могу сохранить файл, когда система зависает.
Мне интересно, можно ли использовать собственный csv-файл и запускать numpy, matplotlib, pandas и т. Д., А не вызывать данные с помощью .excel.
Мне нужно иметь возможность использовать набор данных для базового исследования данных, очистки данных и построения моделей, проверки и т. Д.