Определить личные комментарии питона - PullRequest
0 голосов
/ 09 мая 2018

Итак, я сейчас пытаюсь найти комментарии, в которых человек говорит о себе. Я использую POS-теги Spacy и решил использовать «nsubj», «poss» и «nsubjpass» в качестве индикаторных тегов для первого лица. Конечно, это терпит неудачу с более сложными предложениями, такими как

"Да, в основном заблуждение. Иногда смех" или «Мозг тянет вниз по грязи, паразитам и личинкам вокруг складок. Шепотом шепчет, все это исчезнет?»

Yeah intj
mostly advmod
delusions ROOT
. punct
Occasional amod
voices ROOT
. punct

Буду признателен за помощь в определении таких предложений как личных.

Спасибо

1 Ответ

0 голосов
/ 11 мая 2018

Попробуйте Textacy: что-то на этой линии

список (textacy.extract.semistructured_statements (doc, 'I', cue = 'be'))

...