Извлечь наиболее релевантное место, соответствующее ключевому слову - PullRequest
0 голосов
/ 12 апреля 2019

Я реализую приложение, которое отслеживает местонахождение акул Австралии посредством анализа набора данных Twitter.Поэтому я использую акулу в качестве ключевого слова и ищу твиты, которые содержат «акулу» и фразу местоположения.

Итак, вопрос в том, как определить, что «Эйрли Бич на Харди-Рифе» является тем, который соотносится с «акулой»?Если это возможно, кто-нибудь может предоставить рабочий код Python для демонстрации?Большое вам спасибо!

Ответы [ 2 ]

1 голос
/ 12 апреля 2019

Если вы уже использовали NER для извлечения списка местоположений, можете ли вы создать таблицу целевых слов и назначить вероятности того, что это правильное местоположение? Например, вас интересуют пляжи, а не больницы. Если в этом месте упоминается пляж, вероятность того, что он находится в правильном месте, увеличивается. Другим хакерским способом сделать это может быть определение количества символов или жетонов между словом акула и местоположением - в надежде, что чем меньше расстояние, тем больше вероятность, что слово будет связано с реальной атакой.

0 голосов
/ 12 апреля 2019

Это не простая задача, для этого потребуется распознавание именованных сущностей https://www.quora.com/What-are-the-best-python-libraries-for-extracting-location-from-text

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...