Извлекать ключевые слова / фразы из заданного короткого текста, используя python и его библиотеки - PullRequest
0 голосов
/ 26 марта 2019

Из введенного пользователем ввода описания работы мне нужно извлечь ключевые слова или фразы, используя python и его библиотеки.Я открыт для предложений и указаний сообщества о том, какие библиотеки работают лучше всего, и если в этом случае все просто, пожалуйста, ознакомьтесь.

Пример ввода пользователя:

user_input = "i want a full stack developer. Specialization in python is a must".

Ожидаемый результат:

keywords = ['full stack developer', 'python']

Ответы [ 2 ]

1 голос
/ 26 марта 2019

Хорошо, хороший набор ключевых слов - хороший метод.Но ключ в том, как его построить.Есть много способов сделать это.

Во-первых, самый простой - это поиск открытых ключевых слов, установленных в сети.Это зависит от вашей удачи и ваших знаний.Ваши ключевые слова (например, «python, java, machine learing») являются общими тегами в Stackoverflow, веб-сайтах по подбору персонала.Не нарушайте закон!

Второй - IR (извлечение информации), он более сложный, чем предыдущий.Существует множество алгоритмов, таких как «TextRank», «Entropy», «Apriori», «HMM», «Tf-IDF», «Условные случайные поля» и т. Д.

Удачи.

Для соответствия ключевых слов / фаз, Trie Tree быстрее.

0 голосов
/ 26 марта 2019

Ну, я ответил на свой вопрос.В любом случае спасибо всем, кто ответил.

keys = ['python', 'full stack developer','java','machine learning']
keywords = []
for i in range(len(keys)):
    word = keys[i]
    if word in keys:
        keywords.append(word)
    else:
        continue
print(keywords) 

Вывод был ожидаемым!

...