Как удалить не алфавитно-цифровые (английские) символы в серии, содержащей строки, при этом оставляя пробелы? - PullRequest
0 голосов
/ 06 марта 2019

В настоящее время у меня есть:

[re.sub(r'\W', '', i) for i in training_data.loc[:, 'Text']]

Однако при этом символы хинди остаются и все пробелы удаляются.Есть идеи?

1 Ответ

0 голосов
/ 06 марта 2019

Отрицание может помочь

import re
import string    

re.sub(f'[^{string.printable}]', '', 'asdf #$שדגכ')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...