Предполагая, что вы знаете расположение и тип данных каждого столбца, вам лучше всего выбрать NumPy и функцию loadtxt .
Код для его использования будет выглядеть примерно так:
import numpy as np
dtype = np.format_parser(['f4', 'f4', 'i4'], ['col1', 'col2', 'col3'], [])
array = np.loadtxt(path_to_file, dtype, delimiter=',')
Затем вы можете выполнять операции со всем столбцом, как это.
output = array['col1'] + array['col2']
f4
и i4
относятся к типу данных каждого столбца - f4
- это 32-разрядное число с плавающей запятой, а i4
- это 32-разрядное целое число. Другие варианты: i8
, f8
или aN
для 64-разрядного целого числа, 64-разрядного числа с плавающей запятой и строки длиной N.
Одно предупреждение - если ваши данные содержат строки, содержащие запятые, функция loadtxt не справляется с ними. В этом случае вам придется использовать модуль csv
, как рекомендовано другими авторами.