Что означает «точность на последовательность» и как вычисляется оценка BLEU в тензорном тензоре? - PullRequest
0 голосов
/ 10 апреля 2020

У меня есть вопрос во время моего использования tenor2tensor для задачи text2text.

Я определил проблему и использовал свой собственный набор данных для обучения, на тензорной доске отображаются метрики оценки, которые включают в себя точность, точность для каждой последовательности, и балл BLEU.

Мой вопрос:

  1. В чем разница между "точностью" и "точностью на последовательность"
  2. Как вычисляется BLEU? (Для последовательности или токена)

Предположим, что мой ввод

input1, input2, input3

и вывод

output1, output2, output3, output4

, а основополагающая истина равна

truth1, output2, truth3

Итак, что для этого примера обучения, какова оценка «точность» и «точность на последовательность»? Прочитав metrics.py, думаю, "точность" рассчитывается для каждого токена? (1/3 для этого примера, так как выход2 предсказан правильно), а «точность на последовательность» равна 0? (потому что только когда выходная и заземленная истина полностью идентичны (допускается неправильное выходное значение4), значение может быть равно 1, а «точность на последовательность» вычисляется как completely_matched_example / all_example). Является ли это понимание правильным?

Для вопроса 2 оно аналогично вопросу 1: при подсчете баллов BLEU оно рассчитывается для каждого примера и вычисляется среднее для всех примеров или рассчитывается для каждого токена и отбрасывается понятие «примеры» (т.е. ввод предложения и вывод предложения).

...