Как найти root слова из его причастия настоящего времени или других вариаций Python? - PullRequest
0 голосов
/ 27 мая 2020

Я работаю над проектом НЛП, и прямо сейчас я застрял на обнаружении антонимов для определенных фраз, которые не находятся в их «стандартных» формах (например, глаголы, прилагательные, существительные) вместо причастий настоящего времени, прошедшее время или что-то в этом роде. Например, если у меня есть фраза «прибыл» или «прибыл», мне нужно преобразовать ее в «прибыть». Точно так же «пришел» должен быть «пришел». Наконец, «неудовлетворен» должен быть «неудовлетворен». Кто-нибудь может мне с этим помочь? Я пробовал несколько стеммеров и лемманизаторов в NLTK с Python, но безрезультатно; большинство из них не дают правильного root. Я также думал о сети Concep tNet semanti c и других словарных API, но это кажется слишком сложным для того, что мне нужно. Любой совет полезен. Спасибо!

1 Ответ

0 голосов
/ 27 мая 2020

Если вы знаете, что будете работать с ограниченным набором, вы можете создать словарь.

Пример:

look_up = {'arriving' : 'arrive',
        'arrived' : 'arrive',
        'came' : 'come',
        'dissatisfied' : 'dissatisfy'}

test = 'arrived'
print (look_up [test])
...