Можно ли использовать компромисс для чего-то вроде stemming или лемматизации? - PullRequest
0 голосов
/ 18 марта 2020

Цель состоит в том, чтобы преобразовать следующий текст:

"I am hungry"

в

"i", "be", "hungry"

Я хотел бы использовать для этого компромиссную библиотеку. Лучшее, что я нашел на данный момент, это:

import nlp from 'compromise';
const text = 'the dogs are barking hungrily.'
const doc = nlp(text);
const transformed = doc.verbs().toInfinitive().all().nouns().toSingular().all();

console.log (преобразуется);

В документах по API я не смог найти ничего, связанного со стеммированием или лемматизацией. Но они также говорят :

Поскольку компромисс может сопряжать все виды форм, ему нужно хранить только одну грамматическую форму.

Возможно ли это чтобы получить доступ к этой базовой грамматической форме? Насколько я понимаю, компромисс выполняет поиск в своем лексиконе для каждого термина, чтобы выполнить POS-тегирование et c. Можно ли экспортировать этот поиск тоже?

...