Загрузка различных типов данных из файлов CSV с правильной кодировкой в ​​Python 3 - PullRequest
0 голосов
/ 18 октября 2019

У меня есть файл CSV с различными типами данных. Например: некоторые столбцы являются категориальными (например, название города) Некоторые являются числовыми (например, цена продукта)

Я хотел бы прочитать файл данных с использованием Python 3 таким образом, чтобы все категориальные данные былиГорячее кодирование и числовые данные просто кодируются в виде скалярного значения.

Примерно так:

import numpy as np

x = np.loadtxt(d, dtype={'names': ('city', 'price')
       'formats': (string, int)})

Но здесь я хочу в горячем виде кодировать столбец 'city' какну.

Есть ли какой-либо загрузчик данных / препроцессор в numpy / pandas / scikit, который поможет прочитать csv, а также выполнить горячее кодирование 1 из некоторых столбцов?

...