Выберите точное значение в DataFrame - PullRequest
0 голосов
/ 09 сентября 2018

Я просматриваю фрейм данных UCI для взрослых (https://archive.ics.uci.edu/ml/machine-learning-databases/adult/adult.data). Я хочу вывести и подсчитать все строки, где родной страной является «Германия». Следующий код:

df[df['native-country']=="Germany"]

Говорит мне, что все строки False. Есть ли другой способ подсчитать количество строк и / или распечатать их? Dummie не может быть вариантом, так как в кадре данных более 20 разных стран.

Ответы [ 2 ]

0 голосов
/ 09 сентября 2018

Я думаю, у вас есть белый пробел в поле страны

Попробуйте

df[df['native-country']==" Germany"]

или

df[df['native-country'].str.contains("Germany")]
0 голосов
/ 09 сентября 2018

Ваша команда df[df['native-country']=="Germany"] уже должна печатать только те строки, которые соответствуют условию. Если вы видите строки со значениями False, возможно, вы выполняете df['native-country']=="Germany", который возвращает логическую маску True и False.

Чтобы подсчитать вхождения каждого уникального значения в столбце native-country, попробуйте:

df['native-country'].value_counts()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...