У меня есть файл CSV с различными типами данных. Например: некоторые столбцы являются категориальными (например, название города) Некоторые являются числовыми (например, цена продукта)
Я хотел бы прочитать файл данных с использованием Python 3 таким образом, чтобы все категориальные данные былиГорячее кодирование и числовые данные просто кодируются в виде скалярного значения.
Примерно так:
import numpy as np
x = np.loadtxt(d, dtype={'names': ('city', 'price')
'formats': (string, int)})
Но здесь я хочу в горячем виде кодировать столбец 'city' какну.
Есть ли какой-либо загрузчик данных / препроцессор в numpy / pandas / scikit, который поможет прочитать csv, а также выполнить горячее кодирование 1 из некоторых столбцов?