удаление списка слов из кадра данных - PullRequest
0 голосов
/ 08 ноября 2018

У меня есть фрейм данных из ряда данных, содержащий строки. У меня есть список строк, которые я хочу удалить из каждой строки.

tcl_list = ["tab", "cr", "lf", "doublequote", "singlequote", "eof"]
df[['Summary', 'Description']] = re.sub("|".join(tcl_list), ' ', df[['Summary', 'Description']])

Например:

Из этого:

the tab dog is acting sneaky like a doublequote cat doublequote

К этому:

the dog is acting sneaky like a cat

Однако я получаю эту ошибку:

TypeError: expected string or bytes-like object

Я пытался использовать функции apply () и lambda, но безуспешно. Есть предложения?

1 Ответ

0 голосов
/ 08 ноября 2018

я думаю, что регулярное выражение должно применяться к отдельной строке столбца

df['val'] = ['the tab dog is acting sneaky like a doublequote cat doublequote']

df.val.apply(lambda x: re.sub("|".join(tcl_list),'',x))

или

df.val.str.replace("|".join(tcl_list),'')

Out:

0    the  dog is acting sneaky like a  cat 
Name: val, dtype: object
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...