Я работаю над моделью тем, которая генерирует темы, и у меня есть еще две модели, которые генерируют лучшие предложения на основе тем. Я хочу иметь меру, которая сравнивает две модели, которая генерирует верхние предложения. Я знаю о внутренней оценке UMass и UCI, но думаю, смогу ли я использовать ее интуитивно в моем случае, чтобы проверить, насколько лучше предложения представлены темами.
Я ценю любые предложения, связанные с этой проблемой.