Пространственная ошибка на неназванных векторах при применении простой модели обучения - PullRequest
0 голосов
/ 07 сентября 2018

Я тестирую с помощью простого кода NER. Который напрямую скопирован с сайта spacy https://spacy.io/usage/training. Я просто добавляю spacy импорта и случайным образом сам

import spacy
import random

TRAIN_DATA = [
     ("Uber blew through $1 million a week", {'entities': [(0, 4, 'ORG')]}),
     ("Google rebrands its business apps", {'entities': [(0, 6, "ORG")]})]

nlp = spacy.blank('en')
optimizer = nlp.begin_training()
for i in range(20):
    random.shuffle(TRAIN_DATA)
    for text, annotations in TRAIN_DATA:
        nlp.update([text], [annotations], sgd=optimizer)
nlp.to_disk('/model')

однако, когда я запускаю код. Это показывает ошибку.

Warning: Unnamed vectors -- this won't allow multiple vectors models to be loaded. (Shape: (0, 0))

Я искал сообщество, но понятия не имел. Спасибо за вашу помощь

1 Ответ

0 голосов
/ 07 сентября 2018

Положите nlp.vocab.vectors.name = 'spacy_pretrained_vectors', прежде чем оптимизатору будет достаточно

import spacy
import random

TRAIN_DATA = [
     ("Uber blew through $1 million a week", {'entities': [(0, 4, 'ORG')]}),
     ("Google rebrands its business apps", {'entities': [(0, 6, "ORG")]})]

nlp = spacy.blank('en')
nlp.vocab.vectors.name = 'spacy_pretrained_vectors'
optimizer = nlp.begin_training()
for i in range(20):
    random.shuffle(TRAIN_DATA)
    for text, annotations in TRAIN_DATA:
        nlp.update([text], [annotations], sgd=optimizer)
nlp.to_disk('/model')
...