Пытаясь заменить стоп-слова в панде dataframe, возникает sre_constants.error - PullRequest
0 голосов
/ 06 июня 2018

У меня возникла проблема с удалением стоп-слов из кадра данных панд.Мой код выглядит следующим образом:

for word in stopwords: 
  df['name'] = df['name'].str.replace(word, '')

Я получаю сообщение об ошибке: sre_constants.error: ничего не повторяется в позиции 0. Есть ли какое-либо решение этой ошибки или любой другой способ заменить стоп-слова

1 Ответ

0 голосов
/ 06 июня 2018

Попробуйте df.replace с regex=True:

Пример:

import pandas as pd
stopwords = ["AAA", "BBB"]
df = pd.DataFrame({"name": ["Hello", "World", "AAA", "BBB"]})
print( df["name"].replace("|".join(stopwords), "", regex=True))

Выход:

0    Hello
1    World
2         
3         
Name: name, dtype: object
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...