Как удалить все знаки препинания и другие символы из текстового документа в Python? - PullRequest
0 голосов
/ 13 марта 2019

Я хочу очистить набор данных для классификации. Я хочу удалить все ненужные символы из текста.

как убрать все эти бесполезные символы, чтобы текст был готов к токенизации и расщеплению?

1 Ответ

0 голосов
/ 13 марта 2019

С помощью этого кода вы можете удалить один символ из строки:

x = "abcdef"
x = x.replace("a", "")
print(x)
#output: "bcdef"

Если вы хотите удалить несколько символов, вы можете использовать функцию замены несколько раз с другим символом или вы можете сделать:

x = "abcdef"
to_remove = "be"
for i in to_remove:
    x = x.replace(i, "")
print(x)
#output: "acdf"
...