У меня есть многоколонный фрейм данных с 41 000 строк тегов Flickr. Я хочу удалить все стоп-слова Engli sh только из столбца, оставив другие столбцы без изменений.
Это мой код, извлекающий список стоп-слов из nltk.corpus:
from nltk.corpus import stopwords
stopWordsListEng = stopwords.words("english")
, но Я хочу добавить дополнительные стоп-слова, о которых я могу думать:
according accordingly across act actually
Я не понял, как добавить это в существующий список стоп-слов.
и как я могу применить лямбду удалить стоп-слова только в одном столбце. Потому что я хочу, чтобы мой код был максимально простым.
Вот как выглядит мой столбец:
column1 column2 column3
some words from this column i don't know actually what across to me accordingly 25,000
Я хочу, чтобы мой столбец выглядел так (более или менее) после того, как я удалить все стоп-слова:
column1 column2 column3
some words from this column don't know what to me 25,000