Я столкнулся с дилеммой с функцией стоп-слов в NLTK. Я обрабатываю пользовательский контент с платформы социальных сетей, удаляя стоп-слова, используя NLTK. Однако дилемма состоит в том, что я хочу сохранить личные местоимения в тексте пользователей, которые важны для задачи классификации. К ним относятся такие слова, как «я», «вы», «мы» и т. Д. c.
К сожалению, функция стоп-слов также удаляет эти слова, и мне нужно, чтобы они присутствовали. Как я могу решить эту проблему?