Ошибка - NLTK WordLemmatizer выдает алфавиты вместо лемматизированных слов - PullRequest
0 голосов
/ 28 мая 2020
from nltk import word_tokenize
lemmatizer = WordNetLemmatizer()
def lemmatize_words(row):
    lem_words = [lemmatizer.lemmatize(w) for w in row]
    return (lem_words)

df['Lemmatized Text'] = df.Stopwords.apply(lemmatize_words)

Приведенный выше код выполняет итерацию по всем символам в строке. Я хочу, чтобы строка рассматривалась как список. Ниже приведен мой фрейм данных. Я хочу передать столбец Stopwords в лемматизатор. Текущий вывод представлен в столбце Lemmatized Text

...