Отображение дохода в двоичный - PullRequest
0 голосов
/ 27 сентября 2019

Я пытаюсь сопоставить столбец Income кадра данных с 0 или 1. Создается новый столбец с именем Income Binary.Он основан на столбце Income.Значение 1 означает, что это верно для условия, когда доход человека превышает> 50K.В противном случае значение 0 означает, что условие является ложным, что означает, что доход человека меньше или равен <= 50K.Если запись для <code>Income составляет> 50 КБ, значение будет равно 1 для бинарного дохода.В противном случае это будет 0. Код компилируется, но есть ошибка выполнения.Код размещен ниже.Затем, когда я проверяю количество значений для бинарного дохода, он имеет все 0, что означает, что все ложно, что, как я знаю, не так.

enter image description here

1 Ответ

0 голосов
/ 27 сентября 2019

Использование pandas.Series.map:

  • Код для определения Income_Binary не отображается, но я подозреваю, что вы не правильно оцениваете str вIncome столбец.
    • print(type(df.Income.loc[0])) >>> str, вероятно, относится к вашим данным
import pandas as pd

# Create a test dataframe
df = pd.DataFrame({'income': [random.choice(['<=50K', '>50K']) for _ in range(1000)]})

# map values as desired
df['inc_bin'] = df.income.map({'<=50K': 0, '>50K': 1})

# Output:

income  inc_bin
  >50K        1
  >50K        1
 <=50K        0
 <=50K        0
 <=50K        0
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...