У меня есть данные для изучения машинного обучения, но я придерживался этих строковых особенностей.Я хочу отобразить them(object
) в number(int64)
.
Например, в функции workclass
сделать map(dict)
как {'private':0,'State-gov':1, etc}
.
Итак, как мне с этим справиться в DataFrame, если мне написать цикл for для поискакак n разных классов в объекте, и есть ли n-keys map для каждого объекта?
# There are the code about data reading
import pandas as pd
df_trainFeatures = pd.read_csv('data/trainFeatures.csv')
object_features = ['workclass','education','Marital-status',
'occupation','occupation','relationship','race','sex','native-country']
# list data type
for i in df_trainFeatures:
print(df_trainFeatures[i].dtype,i)
//Printing
int64 age
object workclass
int64 fnlwgt
object education
int64 education-num
object Marital-status
object occupation
object relationship
object race
object sex
int64 capital-gain
int64 capital-loss
int64 hours-per-week
object native-country
Кадр под-данных следующим образом:

Заранее спасибо