Что вам нужно, так это вывод разбора группы в CoreNLP, который дает вам информацию о кусках, например, глагольные фразы (VP), существительные фразы (NPs) и т. Д. Насколько мне известно, хотяв CoreNLP нет способа выдать вам список фрагментов.Это означает, что вам нужно проанализировать фактический результат разбора избирателей, чтобы извлечь куски.
Например, это вывод парсера интересов CoreNLP для примера предложения:
(ROOT (S ("" "") (NP (NNP Anarchism)) (VP (VBZ is) (NP (NP (DT a) (JJ political) (NN philosophy)) (SBAR (WHNP (WDT that)) (S (VP (VBZ advocates) (NP (NP (JJ self-governed) (NNS societies)) (VP (VBN based) (PP (IN on) (NP (JJ voluntary) (, ,) (JJ cooperative) (NNS institutions))))))))) (, ,) (S (VP (VBG rejecting) (NP (JJ unjust) (NN hierarchy))))) (. .)))
Как видите, в строке есть теги NP и VP, теперь вам нужнопойти и извлечь фактический текст кусков, анализируя эту строку.Дайте мне знать, если вы можете найти метод, который дает вам список кусков?!