Удалите китайские скобки и внутренний контент в строковом столбце с Python - PullRequest
0 голосов
/ 09 марта 2020

Я хотел бы удалить скобки китайского типа и их содержимое внутри следующего фрейма данных:

   id                      title
0   1  【第一次拍卖】深圳市光明新区公明街道中心区(拍卖)   ---> (拍卖)need to remove
1   2      【第一次拍卖】深圳市龙岗区龙岗街道新生社区
2   3   【第一次拍卖】(破)广东省深圳市龙岗区布吉新区       ---> (破) need to remove
3   4      【第一次拍卖】深圳市宝安区新安街道新城大道
4   5    (拍卖)【第二次拍卖】深圳市盐田区沙头角东和路      ---> (拍卖) need to remove

Я пытался использовать df['title'].str.replace(r'\([^()]*\)', '') и df['title'].str.replace(r'\([^)]*\)', ''), но они оба могут удалить их, если находятся в конец строки.

0       【第一次拍卖】深圳市光明新区公明街道中心区    ---> this row works
1       【第一次拍卖】深圳市龙岗区龙岗街道新生社区
2    【第一次拍卖】(拍卖)广东省深圳市龙岗区布吉新区
3       【第一次拍卖】深圳市宝安区新安街道新城大道
4     (拍卖)【第二次拍卖】深圳市盐田区沙头角东和路

Как я могу изменить свой код, чтобы получить следующий вывод? Спасибо.

0       【第一次拍卖】深圳市光明新区公明街道中心区 
1       【第一次拍卖】深圳市龙岗区龙岗街道新生社区
2       【第一次拍卖】广东省深圳市龙岗区布吉新区
3       【第一次拍卖】深圳市宝安区新安街道新城大道
4       【第二次拍卖】深圳市盐田区沙头角东和路

1 Ответ

0 голосов
/ 09 марта 2020

Отрабатываются следующие три решения:

df['title'].str.replace(r'\([^()]*\)', '')
df['title'].str.replace(r'\([^)]*\)', '')
df['title'].str.replace(r'\(\S+\)', '')

Out:

0    【第一次拍卖】深圳市光明新区公明街道中心区
1    【第一次拍卖】深圳市龙岗区龙岗街道新生社区
2     【第一次拍卖】广东省深圳市龙岗区布吉新区
3    【第一次拍卖】深圳市宝安区新安街道新城大道
4      【第二次拍卖】深圳市盐田区沙头角东和路
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...