Как отобразить типы объектов в int64 в pandas.DataFrame с большим набором данных - PullRequest
0 голосов
/ 11 октября 2018

У меня есть данные для изучения машинного обучения, но я придерживался этих строковых особенностей.Я хочу отобразить them(object) в number(int64).

Например, в функции workclass сделать map(dict) как {'private':0,'State-gov':1, etc}.

Итак, как мне с этим справиться в DataFrame, если мне написать цикл for для поискакак n разных классов в объекте, и есть ли n-keys map для каждого объекта?

# There are the code about data reading
import pandas as pd

df_trainFeatures = pd.read_csv('data/trainFeatures.csv')
object_features = ['workclass','education','Marital-status',
         'occupation','occupation','relationship','race','sex','native-country']
# list data type
for i in df_trainFeatures:
    print(df_trainFeatures[i].dtype,i)

//Printing
int64 age
object workclass
int64 fnlwgt
object education
int64 education-num
object Marital-status
object occupation
object relationship
object race
object sex
int64 capital-gain
int64 capital-loss
int64 hours-per-week
object native-country

Кадр под-данных следующим образом:

Sub-Data

Заранее спасибо

1 Ответ

0 голосов
/ 11 октября 2018
pandas.get_dummies(data) 

Он преобразует категориальные переменные в фиктивные / индикаторные переменные.

или в вашем случае

pandas.get_dummies(df_trainFeautres['workclass'])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...