Удалить пунктуацию с регулярным выражением - PullRequest
2 голосов
/ 02 июня 2019

Я попробовал следующее, но это

s = '白云区H(52)077楼盘'

''.join(re.findall(u'([\u4e00-\u9fff0-9a-zA-Z]|(?<=[0-9])[^\u4e00-\u9fff0-9a-zA-Z]+(?=[0-9]))', s))

Но я получил 白云区H52)077楼盘 вместо 白云区H52077楼盘

Какой правильный подход?

Спасибо.

Ответы [ 2 ]

3 голосов
/ 02 июня 2019

В моем понимании вы могли бы сделать:

print(re.sub(u'[^\w\s]', '', s))

Какие выходы:

白云区H52077楼盘
0 голосов
/ 02 июня 2019

Попробуйте использовать что-то вроде этого:

replace('白云区H(52)077楼盘', @'[\(\)]', '')

Удачи!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...