Вы можете подойти к этому как к проблеме извлечения информации (IE).В этом случае базовый подход заключается в формулировании набора регулярных выражений, которые приблизительно описывают проблему и уточняют их до тех пор, пока они не станут достаточно хорошими, или вы не сможете продолжить.
Или вы можете ваш любимый синтаксический анализатор и посмотрите, какие деревья / структуры зависимостей он создает для предложений, за которыми вы следите, выясните общий шаблон, проверьте, насколько хорошо он работает, и, возможно, отфильтруйте результаты с помощью регулярного выражения или некоторого предиката длявозвращаемая структура.