Используя панды, могу ли я обнаружить неправильный элемент в фиксированном столбце и вернуть это значение? - PullRequest
0 голосов
/ 15 января 2019

Я новичок в Пандах. Моя цель - обнаружить неправильный элемент в фиксированном столбце и вернуть значение этой строки Вот пример сценария

enter image description here

45 доллар - неправильный элемент в столбце страны. поэтому я хочу определить это значение и вернуть номер строки (если это возможно) в моей программе. Моей первой мыслью было создать список и сопоставить его, или мне нужно искать решение НЛП здесь. Пожалуйста, помогите мне решить это

Ответы [ 2 ]

0 голосов
/ 15 января 2019

Установите pycountry и импортируйте его, отправьте сообщение, которое выполнит следующий код:

[i.name for i in list(pycountry.countries)]

Это даст вам список всех стран.

Сообщениеэта проверка, какие страны попадают в список, и отрицание их, чтобы получить список, какие строки не попадают в список стран.

 import pycountry
 df.Country[~df.Country.isin([i.name for i in list(pycountry.countries)])]

Примечание: Это может не работать, если названия странне поддерживается в имени столбца.

0 голосов
/ 15 января 2019

Некоторые ответы зависят от того, как вы хотите подтвердить свое продвижение вперед. Вы ищете какое-либо значение, содержащее число или любое другое значение, которое не является ожидаемой страной?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...