Задания SageMaker / GroundTruth Labeling для
AWS возвращают показатель достоверности для каждой этикетки, аннотированной человеком. Однако оценка не является прямой функцией ответов N рабочих, которые пометили задачу. Например, для задач, в которых все три рабочих присваивают разные ярлыки, оценка варьируется (0,61, 0,55, 0,68). И там, где 2/3 согласны, оценка также варьируется (0,95, 0,91).
«Автоматическая маркировка данных» отключена, что означает, что все элементы маркируются человеком, а не полностью / частично автоматически классифицируются .
Как AWS вычисляет эти доверительные баллы?