Если вы имеете дело с набором данных, я бы посоветовал вам взглянуть на панд , который мне очень подходит для борьбы с обработкой данных.
Если ваша проблема связана с большим набором данныхВы можете загрузить данные в виде фрагментов.
import pandas as pd
tfr = pd.read_csv('fns_land{0}.csv'.format(xx), iterator=True, chunksize=1000)
- Строка: импортированные модули pandas
- Строка: чтение данных из файла csv в виде фрагментов из 1000 строк.
Это будет тип pandas.io.parsers.TextFileReader .Чтобы загрузить весь CSV-файл, необходимо выполнить следующее:
df = pd.concat(tfr, ignore_index=True)
Параметр ignore_index = True добавлен во избежание дублирования индексов.
Теперь у вас есть всеваши данные загружены в фрейм данных.Затем выполните манипуляции с данными для столбцов как векторов, что также быстрее, чем обычные строки за строкой.
Посмотрите здесь этот вопрос , который имел дело с чем-то похожим.