Есть ли простой способ конвертировать значения в формат int, используя Python? - PullRequest
0 голосов
/ 05 апреля 2020

image

В столбце "Weather_Condition" содержится около 40 различных значений в .csv. Есть ли простой способ сопоставить их целочисленным значениям для последующего использования в переменной col как y в Logisti c Regression?

Ответы [ 2 ]

0 голосов
/ 05 апреля 2020

Как насчет использования Label Encoder?

from sklearn.preprocessing import LabelEncoder
data = ['Light Rain', 'Overcast', 'Cloudy', 'Snow']
lencoder = LabelEncoder()
encoded = lencoder.fit_transform(data)
print(encoded)

Обратное преобразование будет выглядеть следующим образом:

inverted = lencoder.inverse_transform([0])
print(inverted)

Надеюсь, это было полезно.

PS: Также, если вы заинтересованы взглянуть на один горячий кодер;

0 голосов
/ 05 апреля 2020
import pandas as pd

df = pd.read_csv(<filename>)
df['Weather_Condition'] = pd.Categorical(df['Weather_Condition'])
y = df['Weather_Condition'].codes
...