НЛП для извлечения действий из текста - PullRequest
8 голосов
/ 18 ноября 2011

Я надеюсь, что кто-нибудь может направить меня в правильном направлении, чтобы научиться отделять действия от набора текста.

Предположим, у меня есть этот текст

Drop off the dry cleaning, and go to the corner store and pick-up a jug of milk and get a pint of strawberries.
Then, go pick up the kids from school. First, get John who is in the daycare next to the library, and then get Sam who is two blocks away. 
By the time you've got the kids, you'll need to stop by the doctors office for the perscription. Tim's flight arrives at 4pm. 
It's American Airlines flight 331 arriving from Dallas. It will be getting close to rush hour, so make sure you leave yourself enough time.

Я пытаюсь разбить его на

Drop off the dry cleaning,
 and go to the corner store and pick-up a jug of milk and get a pint of strawberries.
Then, go pick up the kids from school. First, get John who is in the daycare next to the library, and then get Sam who is two blocks away. 
By the time you've got the kids, you'll need to stop by the doctors office for the perscription.
Tim's flight arrives at 4pm. 
It's American Airlines flight 331 arriving from Dallas. It will be getting close to rush hour, so make sure you leave yourself enough time.

Я не смог найти ничего в моих поисках, которые бы основывались на конкретных действиях.Это должно быть умнее, чем просто выбирать глаголы, так как есть несколько глаголов, которые иногда связаны с одним действием, например, второй элемент имеет «идти», «забрать» и «получить», но это все частьодного действия.Конечно, «полет Тима» предполагает только действие с настоящим причастием, когда глагол приближается к концу сегмента.

Есть предложения о том, где искать подобные вещи?Что следует остерегаться, рекомендуемые показания и т. Д. И т. Д.

Ответы [ 2 ]

5 голосов
/ 18 ноября 2011

Простой подход: проанализируйте текст, используя [ваш любимый парсер], затем выберите предложения или SBAR фразы, которые находятся в императивном настроении.* * * * * * * * * * * * * * * * * * * * *

* * * * * * * * * * * * * * * * * * * * * * * * * * * *1004* * * * * * * * * *

* * * * *1004* * * * * * *1005* * * * * * * *1005* * * * * * * * * * * * *1004* * * * * * * * * * * 100 * * * * * * * * * * * * * * * 1001006 *

0 голосов
/ 12 октября 2016

Этот домен называется Извлечение информации .

Общий подход к пониманию предложений:

  • извлечение дерева синтаксического анализа с тегом «Часть речи» (Python spaCy.io, nltk, CoreNLP и т. Д.)
  • извлечение слова-вектора (например, word2vec)
...