Какой лемматизатор лучше всего подходит для английского языка? - PullRequest
0 голосов
/ 10 октября 2019

Я хотел бы лемматизировать набор данных с английскими вопросами в Python. Я нашел много пакетов, которые предлагают лемматизаторы (Wordnet, Spacy, TextBlob, Шаблоны клипов, Stanford CoreNLP, Gensim и TreeTagger).

На machinelearningplus упомянуты эти методы, и он утверждает, что сравнивает их. Но сравнение состоит в том, чтобы лемматизировать только одно предложение, и этого недостаточно для того, чтобы сделать выводы для меня.

Кто-нибудь знает более тщательное сравнение? Или кто-то может поспорить, почему я должен / не должен использовать кого-либо из них?

Здесь они также запрашивают английский лемматизатор, но не для какого-либо сравнения.

...