Я использую анализ зависимости пространства. Я озадачен этими двумя очень похожими предложениями.
Предложение 1:
text='He noted his father was a nice guy.'
Обратите внимание, что в этом предложении «отец» явно является субъектом «отец был хорошим парнем»:
[(0, 'He', '-PRON-', 'PRON', 'PRP', 'nsubj'), (1, 'noted', 'note', 'VERB', 'VBD', 'ROOT'), (2, 'his', '-PRON-', 'DET', 'PRP$', 'poss'), (3, 'father', 'father', 'NOUN', 'NN', 'nsubj'), (4, 'was', 'be', 'VERB', 'VBD', 'ccomp'), (5, 'a', 'a', 'DET', 'DT', 'det'), (6, 'nice', 'nice', 'ADJ', 'JJ', 'amod'), (7, 'guy', 'guy', 'NOUN', 'NN', 'attr'), (8, '.', '.', 'PUNCT', '.', 'punct')]
noted
________|_____
| | was
| | _____|___
| | father guy
| | | ___|___
He . his a nice
for child in the_verb.children:
print(child,child.dep_)
>> father nsubj
>> guy attr
for ancestor in the_verb.ancestors:
print(ancestor,ancestor.dep_)
>> noted ROOT
Предложение 2:
text='He noted his father, as \"a man with different attributes\", was a nice guy.'
Это небольшая вариация предыдущего предложения. «отец» больше не предмет.
[(0, 'He', '-PRON-', 'PRON', 'PRP', 'nsubj'), (1, 'noted', 'note', 'VERB', 'VBD', 'ROOT'), (2, 'his', '-PRON-', 'DET', 'PRP$', 'poss'), (3, 'father', 'father', 'NOUN', 'NN', 'dobj'), (4, ',', ',', 'PUNCT', ',', 'punct'), (5, 'as', 'as', 'ADP', 'IN', 'prep'), (6, '"', '"', 'PUNCT', '``', 'punct'), (7, 'a', 'a', 'DET', 'DT', 'det'), (8, 'man', 'man', 'NOUN', 'NN', 'pobj'), (9, 'with', 'with', 'ADP', 'IN', 'prep'), (10, 'different', 'different', 'ADJ', 'JJ', 'amod'), (11, 'attributes', 'attribute', 'NOUN', 'NNS', 'pobj'), (12, '"', '"', 'PUNCT', "''", 'punct'), (13, ',', ',', 'PUNCT', ',', 'punct'), (14, 'was', 'be', 'VERB', 'VBD', 'conj'), (15, 'a', 'a', 'DET', 'DT', 'det'), (16, 'nice', 'nice', 'ADJ', 'JJ', 'amod'), (17, 'guy', 'guy', 'NOUN', 'NN', 'attr'), (18, '.', '.', 'PUNCT', '.', 'punct')]
noted
________________|____________________________
| | | | | as |
| | | | | | |
| | | | | man |
| | | | | ___|______ |
| | | | | | | with was
| | | | | | | | |
| | | | father | a attributes guy
| | | | | | | | ___|___
He , , . his " " different a nice
the_verb=spacy_doc[14]
for child in the_verb.children:
print(child,child.dep_)
>> guy attr
for ancestor in the_verb.ancestors:
print(ancestor,ancestor.dep_)
>> noted ROOT
Я пытаюсь понять, как простор классифицирует предложения. Является ли второй случай ошибкой классификации? Я имею в виду, что "отец" по-прежнему должен быть предметом обсуждения?