Мне нужны предложения, как извлечь ключевые слова из большого документа.Ключевые слова должны быть встроенными, что мы определили как предполагаемые результаты поиска.
Например,
Мне нужно имя владельца, где находится офис, что такое операционная отрасль, когда дается документ о компании, и определенный набор слов будет,
{владелец, директор, офис, отрасль ...} - (1)
предполагаемый результат должен быть примерно таким,
{Mr.Smith James, Main Street, Financial Banking} - (2)
Я искал метод, связанный с семантическим сходством, где предложения, содержащие слова, похожие на данный корпус (1), будет извлечен, и с использованием POS-тегов для извлечения существительных из этих предложений.
Было бы полезно, если бы были предоставлены дополнительные ресурсы, поддерживающие этот подход.