Существует ли модуль машинного обучения, который можно обучать, а затем прогнозировать и извлекать / выделять определенную информацию из текстовых данных.В качестве примера я беру следующие предложения, в которых я ищу то, что было украдено, но не куплено и т. Д.:
The boy stole an apple and a yellow pear.
"яблоко и желтыйгруша "
The boy bought an apple and a yellow pear
.
н / д
The boy bought and apple and stole a yellow pear.
"желтая груша"
я мог представитьрешение с помощью регулярных выражений или NLTK.Но есть ли, например, алгоритм машинного обучения, который принимает один, два и три граммы, а затем предсказывает, насколько высока вероятность того, что каждое слово будет частью результата, основываясь на словах до и после?