Изолировать название страны из столбца Местоположение - PullRequest
0 голосов
/ 17 ноября 2018

У меня есть такие данные вместе с другими столбцами в панде df.Извинения Я не понял, как представить вопрос с кодом для кадра данных.First Post

Расположение: - Токио, Япония - Сакраменто, США - Мехико, Мексика - Мехико, Мексика - Колорадо-Спрингс, США - Нью-Йорк, США - Чикаго, США

Кто-нибудьзнаете, как я мог бы изолировать название страны от местоположения и создать новый столбец только с названием страны?

Ответы [ 2 ]

0 голосов
/ 17 ноября 2018

Вы можете сделать это без каких-либо регулярных выражений - вы можете найти String.indexOf («,«), чтобы найти позицию разделителя в строке, а затем использовать String.substring, чтобы сократить строку только до этого раздела..

Однако регулярное выражение также может легко это сделать, но, скорее всего, будет медленнее.

0 голосов
/ 17 ноября 2018

Попробуйте это:

In [29]: pd.DataFrame(df.Location.str.split(',',1).tolist(), columns = ['City','Country'])
Out[29]: 
               City       Country
0             Tokyo         Japan
1        Sacramento           USA
2       Mexico City        Mexico
3       Mexico City        Mexico
4  Colorado Springs           USA
5             Seoul   South Korea
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...