Как интерпретировать значения умений при использовании udpipe, R - PullRequest
0 голосов
/ 11 ноября 2019

В пакете R udpipe, если мы напишем код:

library(udpipe)
x <- udpipe("The economy is weak but the outlook is bright. the property market will be booming next year", "english")

Результат:

  doc_id paragraph_id sentence_id                                      sentence start end term_id token_id   token   lemma  upos
1   doc1            1           1 The economy is weak but the outlook is bright     1   3       1        1     The     the   DET
2   doc1            1           1 The economy is weak but the outlook is bright     5  11       2        2 economy economy  NOUN
3   doc1            1           1 The economy is weak but the outlook is bright    13  14       3        3      is      be   AUX
4   doc1            1           1 The economy is weak but the outlook is bright    16  19       4        4    weak    weak   ADJ
5   doc1            1           1 The economy is weak but the outlook is bright    21  23       5        5     but     but CCONJ
6   doc1            1           1 The economy is weak but the outlook is bright    25  27       6        6     the     the   DET
7   doc1            1           1 The economy is weak but the outlook is bright    29  35       7        7 outlook outlook  NOUN
8   doc1            1           1 The economy is weak but the outlook is bright    37  38       8        8      is      be   AUX
9   doc1            1           1 The economy is weak but the outlook is bright    40  45       9        9  bright  bright   ADJ
  xpos                                                 feats head_token_id dep_rel deps            misc
1   DT                             Definite=Def|PronType=Art             2     det <NA>            <NA>
2   NN                                           Number=Sing             4   nsubj <NA>            <NA>
3  VBZ Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin             4     cop <NA>            <NA>
4   JJ                                            Degree=Pos             0    root <NA>            <NA>
5   CC                                                  <NA>             9      cc <NA>            <NA>
6   DT                             Definite=Def|PronType=Art             7     det <NA>            <NA>
7   NN                                           Number=Sing             9   nsubj <NA>            <NA>
8  VBZ Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin             9     cop <NA>            <NA>
9   JJ                                            Degree=Pos             4    conj <NA> SpacesAfter=\\n

Я прочитал https://universaldependencies.org/ext-feat-index.html. Но все же яне могу понять, что значит подвиг здесь?

1 Ответ

1 голос
/ 11 ноября 2019

Это морфологические признаки слов. Примерами являются пол, число и падеж существительных;персона, число, аспект для глаголов и т. д.

Эта часть Универсальные зависимости аннотация вообще не является универсальной. Страница, на которую вы ссылаетесь, содержит все морфологические признаки, которые могут отображаться на всех языках UD. Большинство из них не применимы к большинству языков, некоторые явления могут появляться несколько раз под разными именами в разных банках деревьев. Чтобы сделать ситуацию еще сложнее, некоторые древовидные банки, обученные UDPipe, вообще не содержат морфологических признаков. Конечно, тогда UDPipe содержит только то, что он может извлечь из древовидных банков.

UD содержит шесть разных древовидных банков для английского языка, и поэтому в UDPipe также есть шесть разных моделей. На веб-странице UD имеется обзор , в котором объясняется, как различаются древовидные блоки, а также морфологические признаки, используемые для английского языка. По умолчанию для английского языка UD_English-EWT.

...