Очистка данных с использованием Python 3 - PullRequest
0 голосов
/ 30 марта 2020

Я новичок в python и анализе данных, я извлек некоторые данные и хочу очистить их. У меня есть этот фрейм данных:

Имя | Комментарий | ID | Местоположение | время

однако в столбце местоположения есть значения, которые не унифицированы, например, у некоторых людей ( Великобритания ), у некоторых ( UK ), а у некоторых ( соединенное королевство ) в качестве их местоположения.

Я хочу объединить местоположение colomn, чтобы каждая страна идентифицировалась одним именем, а вместо трех разных названий для этой страны я хочу заменить все они с одним уникальным именем.

1 Ответ

0 голосов
/ 30 марта 2020

Вы можете создать словарь, в котором ключи - это все возможные имена, которые вы можете видеть, и значения, в которые вы хотите конвертировать.

Пример:

d = {'united kingdom': 'UK', 'United Kingdom': 'UK', 'uk': 'UK'}

затем

df['new_location'] = df['Location'].map(d)

у вашего df будет новый столбец с именем new_location, и эти ключи будут преобразованы в UK

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...