Машинное обучение для создания ключевых слов для поиска inte rnet - PullRequest
0 голосов
/ 29 мая 2020

У меня есть модель, которая должна предсказывать определенную группу ключевых слов.

Я извлекаю функции из текстового документа. Затем, вместо получения одного окончательного вывода из списка результатов, я хочу спрогнозировать список ключевых слов, которые можно использовать для поиска inte rnet. Как мне go это сделать?

Например: для текстового документа A я должен предсказать такие ключевые слова, как «дантист, опытный, Калифорния»

Учитывая текстовый документ B, я должен предсказать такие ключевые слова, как "хирург, больница Y, Нью-Йорк".

Затем я хочу выполнить поиск в Inte rnet по этим ключевым словам, чтобы найти человека, который является опытным стоматологом из Калифорнии или хирургом, работающим в больнице Y в Нью-Йорк.

Я планирую использовать TF-IDF для извлечения функций из текстового документа, а затем использовать контролируемое обучение для прогнозирования ключевых слов. У меня есть доступ к более ранним данным, в которых упоминаются текстовые документы, соответствующие конкретному человеку в Inte rnet. Может ли кто-нибудь объяснить, как я бы использовал контролируемое обучение, чтобы предсказать эти ключевые слова, или есть ли лучший подход к этому?

...