Я действительно провел исследовательский проект по этому вопросу, выиграл два конкурса и участвую в соревнованиях среди граждан.
В методе два шага :
- Разобрать предложение с контекстно-свободной грамматикой
- В результирующих деревьях разбора найти все существительные, которые подчинены только составляющим, подобным фразе
Например, у «я съел пирог» есть 2 существительных: «я» и «пирог».Глядя на дерево разбора, «пирог» находится внутри фразы глагола, поэтому он не может быть предметом.«Я», однако, только внутри NP-подобных составляющих.будучи единственным субъектным кандидатом, он является субъектом.Найдите раннюю копию этой программы на http://www.candlemind.com. Обратите внимание, что словарь ограничен базовыми единичными словами, и в нем нет спряжения глаголов, поэтому в нем есть «человек», но не «человек», есть «есть», но не"съел."Кроме того, CFG, который я использовал, был ограниченным.Я буду обновлять эту программу в ближайшее время.
В любом случае, есть ограничения для этой программы.Мой наставник указал в своем текущем состоянии, что он не может распознавать предложения с предметами, которые являются «настоящими» NP (то, что грамматика фактически называет NP).Например, «то, что луна плоская, больше не является спором».Предмет на самом деле «что луна плоская».Тем не менее, программа будет признавать "Луну" в качестве субъекта.Я исправлю это в ближайшее время.
Во всяком случае, этого достаточно для большинства предложений ...
Моя исследовательская работа также находится там.Перейдите на страницу 11, чтобы прочитать методы.
Надеюсь, это поможет.