Мне нужна помощь по университетскому проекту. В частности, мне нужно разработать систему обнаружения событий на уровне предложения. Я читал разные статьи, но нашел их слишком абстрактными (вероятно, из-за моей неопытности). Для этого проекта у меня есть набор данных, который содержит тексты, разделенные на токены, которые помечены типом события.
Например: «спик» -> коммуникационное событие, «война» -> враждебное событие и т. Д. c.
Использование этого набора данных не обязательно, но, возможно, это может быть полезно для использования токенов, аннотированных событием, например, триггером события.
Вопрос: как мне сделать, чтобы понять если предложение является значительным как событие, а затем, в конечном итоге, извлечь из этих предложений другую информацию с помощью статистического / вероятностного c или даже машинного обучения?
Заранее спасибо