Извлечение и ранжирование ключевых слов из короткого текста - PullRequest
2 голосов
/ 16 апреля 2019

Я работаю над проектом по извлечению ключевого слова из коротких текстов (3-4 предложения). Используя библиотеку spaCy, я извлекаю фразы и NER и использую их как ключевые слова. Однако я хотел бы отсортировать их по значимости по сравнению с исходным текстом.

Я попробовал стандартные методы информационного поиска, такие как tfidf, и даже пару алгоритмов, основанных на графах, но с таким коротким текстом результаты были не такими хорошими.

Я думал, что, возможно, использование NN с механизмом внимания может помочь мне ранжировать эти ключевые слова. Есть ли способ использовать предварительно обученные модели, поставляемые с spaCy, для какого-либо ранжирования?

1 Ответ

1 голос
/ 17 апреля 2019

Как насчет максимальной предельной релевантности?http://www.cs.cmu.edu/~jgc/publication/The_Use_MMR_Diversity_Based_LTMIR_1998.pdf

...