Как оценить сгенерированный текст, сравнивая друг с другом и выбрать наиболее связное предложение? - PullRequest
0 голосов
/ 18 марта 2020

Я обучил модель GPT2 для автоматической генерации коротких текстов. Некоторые из них хороши, а некоторые повторяют множество слов. Я хочу сохранить хорошие и отказаться от плохих. Я ищу метри c, которая скажет мне, насколько это хорошее предложение. Не волнует абсолютная оценка, а просто относительная оценка между различными текстами. Я ожидаю, что текст типа "I Like it,I Love it,I Love it,I Love it,I Love it,I Love it,I Love it,I Love it," должен быть оценен ниже, чем текст типа "I Like to say That every one is a winner and all are losers". Все метрики оценки, с которыми я сталкивался (СИНИЙ, РОЖОВЫЙ, МЕТЕОР), требуют ссылки и кандидата. Но у меня нет ссылки. Любые идеи, какой лучший вариант я могу использовать, чтобы ранжировать сгенерированные фрагменты текста и выбирать лучшие?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...