Наборы данных STS аннотируются вручную, то есть, мы, люди, в l oop, который сказал, насколько похожи предложения. В наборах данных SemEval есть довольно сложная процедура аннотации, где каждая пара предложений аннотируется несколькими людьми, чтобы обеспечить некоторый консенсус. Это также, как вы можете получить свой пользовательский набор данных.
Оценка STS - это коэффициент корреляции между оценкой сходства, оцененной людьми-аннотаторами, и сходством, оцененным вашей моделью.