Итак, я построил программу NLP, которая учится извлекать описание семантического события из предложения, но сейчас мой тренировочный набор ограничен предложениями, которые я проанализировал в компонентах семантического события моей руки.
Хотя этот метод выполняет свою работу, его вряд ли можно заменить большим предварительно проанализированным корпусом текста.К сожалению, все мои попытки найти такой корпус оказались тщетными.
Что мне конкретно нужно, так это корпус, который пометил семантические роли каждого слова (или группы слов) в предложении.Примерами ролей, которые я имел в виду, являются такие вещи, как:
- агент
- действие
- пациент
- инструмент
- совместноагент
- сопутствующий пациент
- местоположение
- наречие
Если вам нужны какие-либо дополнительные сведения, не стесняйтесь спрашивать или обращаться к этот документ , в котором используется игрушечный корпус с теми же ограничениями, что и у меня.