str.split () работает для '\\', но не '\ n' или '\\ n' - PullRequest
1 голос
/ 18 мая 2019

У меня есть некоторые адресные данные (столбцы в кадре данных), которые выглядят следующим образом:

address
FowlerWhiteBurnettPA\n1395BrickellAvenue\nFourteenthFloor\nMiami,FL33131
Levine&GlassmanLLC\n1655NCommerceParkway\nWeston,FL33326
SimonTrialFirm\nBiscayneBankTower\n2601SouthBayshoreDriveSuite1010\nMiami,FL33133

Я хочу разделить эти столбцы, чтобы сохранить только название фирмы.То есть я хочу иметь только:

firm
FowlerWhiteBurnettPA
Levine&GlassmanLLC
SimonTrialFirm

Код, который я использую:

data['firm'] = data['address'].str.split('\n').str[0]

Однако, это просто возвращает исходный адрес, ничего не меняя.Затем я попытался

data['firm'] = data['address'].str.split('\\').str[0]

Он распадается на '\' и дает мне то, что я хочу.Однако я не знаю, почему «\ n» не работает… Я также пытался разделить на «\ n», что тоже не работает.

Кто-нибудь знает, что здесь происходит не так?

1 Ответ

2 голосов
/ 18 мая 2019

Попробуйте запустить df.address.values.Ваш вывод, вероятно, будет таким:

array(['FowlerWhiteBurnettPA\\n1395BrickellAvenue\\nFourteenthFloor\\nMiam....

Обратите внимание на эти \\n в строке.

Если это так, вам нужно двойное экранирование на \ или обозначение raw_string r'...' иодиночный переход для \ следующим образом:

df.address.str.split('\\\\n').str[0]

или

df.address.str.split(r'\\n').str[0]

Out[147]:
0    FowlerWhiteBurnettPA
1      Levine&GlassmanLLC
2          SimonTrialFirm
Name: address, dtype: object
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...