Понимание результата оценщика Spacy - PullRequest
0 голосов
/ 01 июня 2018

Я оцениваю пользовательскую модель NER, построенную с использованием Spacy.Я оцениваю тренировочные наборы, используя класс Spacy's Scorer.

    def Eval(examples):
    # test the saved model
    print("Loading from", './model6/')
    ner_model = spacy.load('./model6/')

    scorer = Scorer()
    try:
        for input_, annot in examples:
            doc_gold_text = ner_model.make_doc(input_)
            gold = GoldParse(doc_gold_text, entities=annot['entities'])
            pred_value = ner_model(input_)
            scorer.score(pred_value, gold)
    except Exception as e: print(e)

    print(scorer.scores)

Он работает нормально, но я не понимаю вывод.Вот что я получаю за каждый тренировочный набор.

{'uas': 0.0, 'las': 0.0, 'ents_p': 90.14084507042254, 'ents_r': 92.7536231884058, 'ents_f': 91.42857142857143, 'tags_acc': 0.0, 'token_acc': 100.0}

{'uas': 0.0, 'las': 0.0, 'ents_p': 91.12227805695142, 'ents_r': 93.47079037800687, 'ents_f': 92.28159457167091, 'tags_acc': 0.0, 'token_acc': 100.0}

{'uas': 0.0, 'las': 0.0, 'ents_p': 92.45614035087719, 'ents_r': 92.9453262786596, 'ents_f': 92.70008795074759, 'tags_acc': 0.0, 'token_acc': 100.0}

{'uas': 0.0, 'las': 0.0, 'ents_p': 94.5993031358885, 'ents_r': 94.93006993006993, 'ents_f': 94.76439790575917, 'tags_acc': 0.0, 'token_acc': 100.0}

{'uas': 0.0, 'las': 0.0, 'ents_p': 92.07920792079209, 'ents_r': 93.15525876460768, 'ents_f': 92.61410788381743, 'tags_acc': 0.0, 'token_acc': 100.0}

Кто-нибудь знает, что это за ключи?Я просмотрел документацию Спейси и ничего не смог найти.

Спасибо!

1 Ответ

0 голосов
/ 01 июня 2018
  • UAS (Оценка без маркировки вложений) и LAS (Оценка с маркировкой вложений) являются стандартными показателями для оценки анализа зависимостей.UAS - это доля токенов, голова которых была правильно назначена, LAS - это доля токенов, голова которых была правильно назначена с правильной меткой зависимости (субъект, объект и т. Д.).
  • ents_p, ents_r, ents_f - это точность, отзыв и fscore для задачи NER.
  • tags_acc - это точность POS-меток.
  • token_acc представляетсяточность для сегментации токенов.
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...