Функция суммы панд - PullRequest
0 голосов
/ 18 октября 2019

введите описание изображения здесь

^^^^^

Это вывод, который я получаю на печать (final_train.income), где final_train - мой фрейм данных.

LTE50 = (final_train.income == '<= 50K'). Sum () </p>

По какой-то причине LTE50 всегда равен 0, когда я вижу, что доход колонки содержит <= 50K. Любая помощь с благодарностью. </p>

1 Ответ

0 голосов
/ 21 октября 2019

Этот код должен работать. Я предполагаю, что там есть другие пустые символы, такие как пробелы. В зависимости от того, что еще находится в этом столбце, кроме «<= 50 КБ», я бы попытался удалить этот столбец пробелов. </p>

#  Creates a new column
final_train['strippedincome'] = final_train.income.str.strip()  
LTE50 = (final_train.strippedincome == '<=50K').sum()

или

#  Strips existing column in place
final_train['income'] = final_train.income.str.strip()  
LTE50 = (final_train.income == '<=50K').sum()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...