Я работаю над проектом по извлечению ключевого слова из коротких текстов (3-4 предложения). Используя библиотеку spaCy
, я извлекаю фразы и NER и использую их как ключевые слова. Однако я хотел бы отсортировать их по значимости по сравнению с исходным текстом.
Я попробовал стандартные методы информационного поиска, такие как tfidf
, и даже пару алгоритмов, основанных на графах, но с таким коротким текстом результаты были не такими хорошими.
Я думал, что, возможно, использование NN с механизмом внимания может помочь мне ранжировать эти ключевые слова. Есть ли способ использовать предварительно обученные модели, поставляемые с spaCy, для какого-либо ранжирования?