Режим должен быть одним из PorterStemmer.NLTK_EXTENSIONS - PullRequest
0 голосов
/ 02 октября 2019

Я пытаюсь создать столбец фрейма данных, используя технику Porterstemmer, но я получаю следующую ошибку.

Режим должен быть одним из PorterStemmer.NLTK_EXTENSIONS

Гуглил его, но не смогнайти любые соответствующие ответы. Подобных вопросов о переполнении стека также нет.

Имя: question1, dtype: object 0 Какое пошаговое руководство по инвестированию в sh ... 1 что бы произошло, если бы правительство Индии остановилось? .2 как можно увеличить скорость интернета, взломав ... 3 найти остаток, когда [математика] ^ {} [/ математика] отличается ... 4 какая рыба выживет в соленой воде? Имя: question1, dtype: object

df_train ['question1'] = df_train ['question1']. Apply (word_tokenize) print (df_train ['question1']. Head ())

из nltk.stem.porter import PorterStemmer stemmer = PorterStemmer ("english")

df_train ['question1'] = df_train ['question1']. apply (лямбда-x: [stemmer.stem (y) для yв х]) print (df_train ['question1']. head ())

Вывод:

Traceback (последний вызов был последним): 0 [чем, шаг,, step, guide, to, inv ... Файл "C: / Users / ashwin / PycharmProjects /ходимость / подобие / поиск совпадений / образец / алгоритм / Similarity_calculator.py", строка 48, в

1 [что,произойдет, если, индийский, правитель ... stemmer = PorterStemmer ("english")

2 [как, может, интернет, скорость, быть, увеличен, ... Файл "C": \ Users \ ashwin \ PycharmProjects \ match \ env \ lib \ site-packages \ nltk \ stem \ porter.py ", строка 94, в init

3 [найти,остаток, когда, [, математика,], ^, {, ...

4 [который, рыба, выжил бы, in, соль, вода,?] Имя: question1, dtype: object "Режим должен быть одним из PorterStemmer.NLTK_EXTENSIONS," ValueError: Mode должен быть одним из PorterStemmer.NLTK_EXTENSIONS, PorterStemmer.MARTIN_EXTENSIONS или PorterStemmer.ORIGINM_27G

...