Я работаю над проектом в тот момент, когда было бы очень полезно иметь возможность определить, когда определенная тема / идея упоминается в тексте. Например, если текст содержал:
Возможно, если вы расскажете мне немного больше о том, кто такой мистер Джонс, это поможет. Также было бы полезно, если бы у меня было описание его внешности или даже лучше фотография?
Было бы здорово обнаружить, что этот человек попросил сфотографировать мистера Джонса. Я мог бы пойти по-настоящему наивным подходом и просто найти слово «фотография» или «фотография», но это было бы бесполезно, если бы они написали что-то вроде:
Пожалуйста, никогда не присылайте мне фотографию мистера Джонса.
Кто-нибудь знает, с чего начать? Это вообще возможно?
Я изучал такие вещи, как nltk, но мне еще не удалось найти пример того, как кто-то делает что-то подобное, и я до сих пор не совсем уверен, как называется этот вид анализа. Любая помощь, которая может поднять меня с ног, была бы великолепна.
Спасибо!