что означают головы в данных о пространственном обучении? - PullRequest
0 голосов
/ 12 апреля 2020

Я пытаюсь обучить модель своим собственным данным и использую библиотеку Spacy.

Но я запутался по поводу "# index of token head" в примере кода.

что именно здесь означают головы?

# training data: texts, heads and dependency labels
# for no relation, we simply chose an arbitrary dependency label, e.g. '-'
TRAIN_DATA = [
    (
        "find a cafe with great wifi",
        {
            "heads": [0, 2, 0, 5, 5, 2],  # index of token head
            "deps": ["ROOT", "-", "PLACE", "-", "QUALITY", "ATTRIBUTE"],
        },
    )

1 Ответ

0 голосов
/ 12 апреля 2020

В вашем примере задача состоит в том, чтобы восстановить дерево синтактий c зависимостей . Это дерево показывает для каждого слова соответствующее слово «заголовок», к которому оно прикреплено, и тип вложения. Один конкретный формат, в котором описаны такие деревья, называется CoNLL-U .

В вашем примере, например, "great" (слово 4, если мы считаем от 0) присоединяется к "wifi" (слово 5), а "great" - это качество of " вай-фай". Следовательно, 4-я запись в heads равна 5, а 4-я запись в deps равна «КАЧЕСТВО».

...