Question

У меня есть фрейм данных со столбцом, содержащим адрес и некоторый текст после него.

например:

Address
123 Fake St, Boulder, CO 80304 Attached Dwelling/
345 Main St, Boulder, CO 80304 Vacant Land/Lots
456 Cool Dr, Erie, CO 80516 Attached Dwelling/Building

Это то, что я хотел бы сделать

Address                               Type
123 Fake St, Boulder, CO 80304        Attached Dwelling/
345 Main St, Boulder CO 80304         Vacant Land/Lots
456 Cool Dr, Erie, Co 80516           Attached Dwelling/Building

Я думал, что это может сработать, используя регулярное выражение для поиска первого di git, но работая справа налево. Однако я получаю сообщение об ошибке «ValueError: столбцы должны иметь ту же длину, что и ключ»

df[['Address', 'Type']] = df['Address'].str.rsplit('\d', n=1, expand=True)

wwnde · Answer 1 · 14 июля 2020

Пожалуйста, split на пробеле с пятью цифрами сразу слева и разверните разделение, если вы хотите использовать split

 df.Address.str.split('(?<=\d{5})\s+', expand=True)


                         0                           1
0  123 Fake St, Boulder, CO 80304          Attached Dwelling/
1  345 Main St, Boulder, CO 80304            Vacant Land/Lots
2     456 Cool Dr, Erie, CO 80516  Attached Dwelling/Building

Daniel Geffen · Answer 2 · 13 июля 2020

По-видимому, существует известная проблема: rsplit не работает с регулярным выражением ( SO question , open issue ).

Разделить столбец на основе последнего найденного di git

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Разделить столбец на основе последнего найденного di git

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов